1.4 数据流通层
1.4.1 技术框架
数据基础设施的交易流通层主要实现数据运维、数据运营、数据交易三方面功能,支撑数据资产从汇聚、存储、加工到交易的全生命周期的各环节。数据流通层技术框架如图1-6所示。

图1-6 数据流通层技术框架
1.数据运维
数据运维管理主要涵盖数据汇聚(主要包括数据接入、数据存储等)、共享交换、数据整理、资产管理(主要包括资产编目、分类分级等)、平台管理、安全管理等内容。其中:
——数据汇聚,实现分布的、异构的、跨网络的各部门政务信息资源的交换汇聚,实现统一平台与各部门数据资源的共享。
——共享交换,实现跨部门、跨层级数据的可信共享、可信交换。
——数据整理,通过有效的数据资源控制手段,实现数据管理和控制,提升数据质量。
——资产编目,按照一定的标准和规则,对数据资源进行分析、选择、描述,并记录为款目,实现数据按一定顺序组织成目录。
——分类分级,实现数据资源合理分类、分级管理。
——平台管理,实现数据运维平台的监控告警、数据接入、数据存储、查询检索、数据处理等功能。
——安全管理,建立技术和管理安全防护措施,保护计算机硬件、软件和数据不因偶然或恶意的原因遭到破坏、更改和泄露。
2.数据运营
数据运营主要涵盖数据开发(主要包括综合开发、融合开发和创新专区等)、数据处理(主要包括数据清洗、数据沙箱、数据标注、数据富化、数据筛选、数据脱敏等)、算法工具、数据安全加工环境(主要包括访问控制、隐私计算、数据溯源、可信执行、数据隔离等)等功能。其中:
——数据清洗,提供智能化的数据清洗工具。
——数据沙箱,在隔离环境中,提供用以测试不受信任数据的工具。
——数据标注,提供数据标注模板及工具。
——算法工具,提供数据结构和算法可视化工具。
——访问控制,提供用户身份、策略组、数据资源功能,实现用户访问控制。
——隐私计算,通过联邦学习、安全多方计算、机密计算、差分隐私、同态加密等隐私保护计算技术,打通数据开放共享服务通道。
——数据溯源,通过区块链等技术记录原始数据在整个生命周期内(从产生、传播到消亡)的演变信息和演变处理过程。
——数据隔离,通过磁盘、存储、网络等多重隔离技术手段,构建数据安全区域。
3.数据交易
数据交易主要涵盖价值评估、交易定价、数据交易、收益分配等内容。其中,
——价值评估,提供数据资产价值评估模型、评估标准及评估流程管理。
——交易定价,提供数据资产交易定价管理、定价标准管理等。
——数据交易,提供数据订单管理、交易管理、营销管理、发票管理、交易统计等功能。
——收益分配,提供分配用户、收益分配和权益保障等功能。
1.4.2 运营加工技术
1.数据可信交换技术
数据可信交换是数据运营的基础。根据数据敏感度不同,可构建非加密传输通道和加密计算通道两类可信交换能力。在非加密传输通道引入区块链技术,解决身份认证与信用问题,并结合信任链构建权责清晰的可信共享通道;在加密计算通道引入区块链技术,解决数据隐私保护以及流通全程监管的存证问题。
数据要素来自政府、企业和个人等多源数据生产方,需要保证数据来源可靠,数据流通可管可控。通过数据要素来源认证、邀约、协商等机制确立可信数据流通的参与方,保证各个参与方都是可靠的。数据生产方可制订数据隐私策略,如脱敏、加密、数字水印等,保障数据在源端已被保护。
数据流通过程中需要采用不同的数据隐私计算技术,满足数据提供方、数据中介和数据消费方等主体的数据隐私保护诉求。隐私计算技术包括联邦学习、多方安全计算、TEE(可信执行环境)、差分隐私等,可根据实际的场景需求来选择。在保证合法合规的前提下,以数据收集最小化为原则,实现多参与方或多计算节点之间开展高效率的联邦学习,当前多应用于金融反欺诈、联合风控等场景;多方安全计算解决不信任的各个参与方各自持有的私密数据协同计算的问题,保证数据消费方在获取正确结果的同时,无法获取计算结果之外的信息,当前多应用于投票选举等场景;TEE(可信执行环境)基于硬件防护能力的隔离执行环境,构建芯片级别的安全计算。
数据可信交换技术框架如图1-7所示。

图1-7 数据可信交换技术框架
数据要素在流通过程中除了要遵循相应的法律法规外,还要能保障数据要素流通全链路可追溯、可审计。通过构建数据流通链,利用区块链技术保护数据源、数据目录等不受恶意篡改,对数据要素计算过程存证以防止行为抵赖,对数据要素流通过程进行审计以实现行为追溯,解决多方数据隐私计算可信协作和信任传递问题,保障数据资产权属清晰、价值和信任的有效传递。通过数据开发服务,将数据资源加工成数据产品和服务,构建模型审定、规则审核、模型开发、评估定价、登记确权等数据安全流通能力,为数据要素交易和数据价值场景提供技术支撑。
2.数据开发利用技术
数据开发利用主要基于多方安全计算、联邦学习、TEE、区块链技术等,实现多方数据核实、相关分析、安全数据查询以及联合建模等功能。用户可以通过可视化界面进行数据的上传、融合、处理以及模型训练和预测,降低用户使用门槛,大幅提升了数据处理和建模的效率;针对两种不同的计算引擎,都预置了大量函数库供用户选择,满足不同场景下的函数需求。同时支持用户自定义函数,用户只需提供Python脚本即可使用;基于TEE计算引擎,以及混合计算引擎,可以在数据不出域的情况下进行密文联合计算,实现数据合作。
数据开发利用环境是关键,根据客户实际需求和业务场景提供针对性的产品形态,主要包括数据安全隔离域、联邦学习平台、可信硬件执行环境三个方案。其中:
●数据安全隔离域。一款安全驱动的数据分析和AI工作台,通过数据脱敏、数据置换、数据抽样、用户权限和数据权限管控,将运行环境和调试环境分离,外部数据分析人员只能在调试环境中对样本数据进行数据分析、模型构建,然后将模型部署至运行环境进行训练,最后只输出运行结果。数据安全隔离域不仅能够帮助数据拥有方保护数据安全,防止二次分发导致的泄露和失控,而且可助力数据需求方更好地进行数据分析,最大限度地挖掘数据可用价值。
●联邦学习平台。基于数据安全和隐私保护技术,在数据不出本地的情况下,与多个参与方之间通过共享加密数据的参数交换与优化来进行机器学习,建立虚拟共享模型,实现数据的多方协同和授权共享,得到更准确、更高效的模型和决策,进一步释放数据价值。联邦学习平台旨在将政府数据赋能金融、汽车、教育、互联网等行业客户,满足风险控制、精准营销等场景的业务需求,打破数据孤岛,实现数据价值的充分流动。
●可信硬件执行环境。通用安全计算平台是强安全、高性能、易扩展的芯片级数据安全计算解决方案。协助机构之间解决数据合作过程中的数据安全和隐私问题,打破数据孤岛。通过私有化或云服务帮助金融、政务、互联网等行业在联合建模、联合营销、联合风控等场景下一站式完成数据联合计算,实现“数据可用不可见”的安全体验。
1.4.3 交易流通技术
数据要素交易需要在政府及第三方机构的监管下,制定合适的市场定价机制及收益分配机制,以实现数据生产方和消费方的数据交易,并使各方均获得一定的收益,保证数据交易市场可持续发展。数据要素交易流通技术主要涵盖数据价值评估、交易定价、交易支撑和收益分配等内容,为数据供应方和需求方提供灵活、便捷的数据交易服务。数据要素交易流通技术框架见图1-8。
数据要素交易流通所涉及的权属界定、价值评估等仍主要处于研究层面,尚未形成定论,如数据价值评估主要参考无形资产的成本法、收益法、市场法等评估方法。目前数据要素交易流通主要采取撮合交易的方式,由市场定价,所涉及的技术主要用于数据要素交易平台的建设。数据要素交易平台是数据资产市场化运营平台。由数据生产方、数据消费方、运营监管方、数据中介等数据要素市场参与主体共同构建新型要素市场体系,让每个市场主体可以平等获取、自由买卖、公平交易、智能结算,形成可持续、自循环、平衡的数据要素市场生态。

图1-8 数据要素交易流通技术框架
数据要素交易平台包含运营支撑、交易结算、供应管理、用户中心和交易门户五大组成部分,通过建立规范化、流程化的数据要素运营体系,提供数据要素化过程的运营保障,服务于数据要素流通的全业务流程。其中,运营支撑模块支持市场运营方对数据产品和服务的管理、运营、交易管理及用户管理等功能。交易结算模块支持市场运营方实现交易邀约发起、交易执行、交易信息匹配、产品计费管理、交易结算等一系列功能。供应管理模块支持数据生产方对数据产品和服务的发布、订单、售后等进行管理。用户中心模块支持数据消费方进行用户注册及验证、订单查看、对账、开发票等。交易门户模块支持数据生产方上架数据产品和服务,数据消费方可进行数据产品和服务的选购,完成后即可使用数据产品和服务。