二、实现数据从要素到资源的转换
2019 年,在党的十九届四中全会上,我国第一次在党的文件中将数据作为与土地、资本、劳动力、技术相并列的第五大要素。2020 年,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称《意见》)更是列出单节,针对数据市场存在的体制机制问题,提出政府数据共享、社会数据价值提升、数据的资源整合和安全保护等方面的改进建议,并从数据市场、交易、自律机制和场景运用等方面,健全数据要素市场的运行机制。这意味着数据将从“要素”转向“资源”,使得数据可进行商业交易和流通使用,但要提高交易流通效率,还需开展大量基础设施建设工作。
1.如何使数据成为可交易的对象
数据要素交易,不是成立一个数据交易所就可以实现的,需要大量的基础设施支撑。贵阳的数据交易所成立后,交投并不活跃,某种程度上反映了我国还缺乏成熟的数据交易基础设施。
数据从要素转化为资产和资源的关键,是找到可作为交易对象的数据形式,明确数据边界和权利边界并以法律方式显性确定(确权),规范数据资产的定价等。
数据作为信息的载体,具有“服务业”的特点,大部分甚至存在“查看”就是消费的特征。直接将原始的“源”数据作为交易对象,价值较低,如同工业时代的原材料。现实世界有无数提取数据的视角和方法,如我们现在不同学科就是对同一个现实世界透过不同视角的观察。在动态演进的世界,不同层次、不同视角和不同使用目的,将导致数据之间存在巨大差异,尤其是汇总之后的数据。如对中小微企业的定义,国家发改委、工信部、人行和银保监会有不同的认定方法,很难不经过处理而直接比较。由于没有预先确定看世界的层次、视野和视角,没有统一概念的内涵与外延,可能产生口径标准的“不一致”和数据缺乏、重复共存的“不连续”,不仅提高使用成本,还缩小了价值提升的空间。数据的使用需要提前介入数据收集、清洗和汇总等环节,但又不能过度专业化,影响数据的使用范围。更重要的是,“源”数据往往还涉及数据获取主体的商业秘密,有时甚至是核心价值。同时,这些“源”数据又具有广泛的再开发价值,“敝帚自珍”会严重制约数据价值的充分开发和深入挖掘。
因而,数据交易对象的选择需平衡数据的有用性和隐秘性,根据数据和应用特性采取不同的方式。典型的如纯粹的数据公司,初期出现过出售原始数据的行为,但近些年逐渐演化为对数据及时更新、清洗、汇总,并提供丰富的数据开发软件,将数据固化于软件之中,从卖数据转化为卖“端口”、卖服务。又如近些年国际上较为流行的“开放银行”,为保证银行底层数据安全,包括保护个人隐私和商业机密,以及确保数据不被污染,即修改、增加无效数据等,采取了搭建允许半标准化程序的再开发平台。第三方机构可以在这个平台上,利用平台提供的标准化模板,实现对数据和程序的再开发,满足多样化的现实需求。当然,为了保证数据开发和使用过程价值的内部化,也可以通过合作开发、股权合作等方式实现数据的交易。
实现数据要素的可交易,还需要从法律上清晰界定数据处理各个环节的权利边界,即确权。数据的采集、清洗整理、汇总和使用等环节,包括数据的使用、变更、处置等权利,都需要清晰的法律界定。例如,我国对统计数据有严格的法律规定,但对行业、局部的数据收集、整理(如指数化)是否可以,或者可以收集、整理到什么程度,是否能对外发布,均无相关规定。随着我国金融交易越来越多使用各类指数,可以预见,指数的编制会越来越普遍。与此相悖,目前几乎全部指数的所有权都归属于指数发布机构,这是否有利于指数的多样化?诸如此类,等等。
数据资源的适当标准化和合理定价方法也是需要解决的基础性技术。资产只有合理定价,且定价方式得到普遍认可,才有可能稳定持续交易。非标准化产品交易不活跃,流动性差,是因为交易各方对资产标的无法形成准确认知,无法按照普遍认可的定价方式定价。因而,数据资源如何适当地标准化,节约交易双方信息收集、彼此信任和沟通成本,形成适合技术资源的普遍认可的定价方式,成为深化数据资源交易的关键。
2.隐私保护和垄断问题
数据要素还涉及“被映射对象”的权利义务,其中最重要的就是隐私保护问题。当数据只是映射自然界等非自然人时,没有主体主张隐私保护。而当数据延伸到自然人、团体时,涉及活动的主体,隐私保护问题就成为不得不关注的内容。社会活动主体的信息收集、处理和利用,需要获得当事人的同意,并仅用于特定目的,以保证社会活动主体信息的完整和安全。
目前我国针对个人信息保护的规定,散见于多部法律法规和各种文件中。近些年我国数据产业飞速发展,随之出现了不少数据“黑市”,个人信息泄露事件频发,因此迫切需要一部法律统一规范,包括界定个人信息范畴,规范信息的收集、存储、使用、共享、跨境传输等多个环节,并针对政府数据处理、企业商业化利用等不同主体不同应用场景,以平衡个人、企业和公共利益。
数据的特殊性在于,一方面,数据收集前需要当事人明确授权同意;另一方面,数据的复制又几乎没有成本,这就让数据具有显著的规模经济和范围经济效应,从而导致在数据要素资源化和资产化的过程中,极易引发垄断。
从数据是现实世界映射的角度来看,关键是管理好数据与现实世界的连接渠道,包括收集(数据形成时的连接)和应用场景(数据最终使用时的连接)两个维度。有必要从数据所反映世界的“权责利”,维持必要的多元竞争,特别是从保证“不唯一”角度加以规范。信息处理能力的提高往往是在数据使用过程中逐步迭代升级的,是用户和信息软件开发者共同提高的过程,过程中容易出现“先行者优势”甚至是“独占”的情况。为此,有必要在根据成本、效率选择信息处理机构外,保持必要的冗余。在政府和平台的采购中,除了要比较稳定性、运行效率和成本外,还要鼓励在确保安全的前提下,以一定比例允许其他开发者参与市场,进入迭代升级进程,保证市场提供者“不唯一”,防止市场力量过度“不均衡”。特别是引入了云存储、云计算技术后,在小比例的存储、计算和特定时间段的运行,引入“不唯一”的供应商,以便平衡安全、效率和稳定问题。
总之,我国已把数据要素作为核心投入要素,就有必要加大要素市场的基础设施建设力度,强化数据要素市场的规范和监管,合理界定数据要素及其生产过程中的权利归属,提高数据要素的定价和流通效率,实现从数据要素到数据资源再到数据资产的转换。