一、数据及其价值来源
数据 在文字出现以前就已存在,如结绳记事。人类创造文字和数字 之后,便通过文字和数字进行思考和交流。计算机普及后,现实世界的各种呈现,都可以用“0”“1”数字代码记录。尤其是进入数字时代后,我们通过物联网等方式自发采集数据,并运用互联网、区块链等技术连接数据,再通过人工智能等方式自动分析和使用数据,数据在社会中更顺畅地流动,其价值被更充分地挖掘。如果将概念、图像、声音等当成广义的数字空间 ,正如佛教中谈到的“婆娑世界”,我们其实一直生活在类似数字描述的非真实空间里。
1.数据是认知世界的一种视角
从数据视角观察,“世界即数据”。人类世界包括物理世界和人类社会,既是数据所反映的世界(以某种映射标准,转化为概念文字、图像、声音等数据,并用数字化的方式记录),也是人类借助数据,描述、认识、研究并希望改造的对象。在这个意义上,可以说数据只是“媒介”,最终是为了人类可以更好认识、改造并利用现实世界。从人类的角度来看,现实世界是数据的最初来源和最终归宿。
具体而言,数据是人类生活的现实世界(物理世界和人类社会)的一种映射,是用“数字”方式 描述现实世界的状态、变换和关系等。这样,世界就分离为现实和数字两个平行世界。将现实世界通过一定方式映射到数字世界,可以较为精准地描述现实世界,并按照人类熟悉的认知方式模拟现实世界运行。此外,还可寻找其中存在的规律,并低成本模拟出可以实现人类意图的最佳方式,将最终结果以现实世界可行、也最有效率的方式实现达到更好服务人类的目的。
事实上,实体经济处于“投资、生产、分配、消费、储蓄”循环之中。物物交换、储蓄和投资的交换,通过货币化和金融化映射到货币金融体系(数字空间的一种),实现合理配对并反作用于实体经济。引入数字世界后,更多的实体经济活动,如消费、生产,而不仅仅是投资和储蓄行为,被实时地映射到数字空间,进行更可靠地记录、连接和分析处理,拓宽原货币金融体系可处理的空间,提高连接和处理效率。因此,可认为原有的货币金融体系是一种原始的数字经济。当前,数字经济的发展只是改变了连接、记录、存储和处理手段,并没有改变数据背后所反映的行为逻辑和权利义务关系。
我们可以用下图来粗略表达实体经济、金融和数字技术间的关系。
▲ 经济循环中的数字空间
从数据的收集、汇总和分析运用角度看,数据总是基于人们的某种认知,在特定技术背景下,对所描述“对象”进行抽象而成。可以认为现实世界是全息世界,数据展现的世界是通过一定视角观察而提取的世界。数据化的过程,就是选择的过程。选择天然隐含某种标准,并反映一定的价值倾向。做过数据清洗和汇总的,都能深刻体会不同机构、不同渠道、不同方式收集到的不同层次的数据,在汇总过程中平衡和统一不同标准、视角、层次的艰辛和困惑。
▲ 数据的映射关系
2.数据的权利和价值来源
数据空间的权利、价值来源于现实世界,是第二性的。即不宜就数据谈数据权益,或者仅在数字空间谈数据运用,需与数据所映射的对象相联系,与数据再加工过程中人的劳动相联系。
数据的价值,主要是借助特定算法和模型使用体现,最终通过出售内嵌数据的产品和服务实现。即数据最终的价值取决于对人类的有用性。
数据在最终价值的实现中,发挥以下三种功能。
一是提供新认知的可能性。通过更广泛、更细致、具有实时反馈的动态数据,可以更好地了解和感知研究对象,提供探索新规律、新特征科学研究和技术开发的条件,也为人类认知新事物提供更可接受的方式,甚至可以通过了解、培育人类新的欲望,生成新的需求,从而开发出新的价值点。
二是降低现实世界中的试错、配对等交易成本。现实世界是物质、能量和信息的流动,也是结构匹配的过程。现实世界的探索和配对,需要耗费现实世界的真实资源,但在数字空间的模拟世界中,可以几乎不耗费真实资源,达到资源优化配置的效果。
三是减少人类行为的主观不确定性,提升处理效率。人类在决策和行为的过程中,不仅要面对现实世界的不确定性(未知),也要面临由于数据收集的成本、时间和难度等认知不全面引发的主观不确定性。数字空间通过数据的集中、汇总,大大降低了主观不确定性,从而提高决策和行为的确定性和效率。
数据的产生过程,涉及数据所反映的对象,数据的收集、清洗、汇总、分析和最后的运用等不同环节。每个环节都对创造数据最终价值有所贡献。用什么方式分离、评判并实现每个环节的价值,很大程度上取决于数据特点、数据产业的市场结构及其运行和分配机制。
考虑到社会和技术发展具有“反身性”特征,即对自身的认知最终会改造自身,数据的生产、改造和使用与数据所反映对象并不独立。因此,当数据所反映对象为人或机构时,我们需要高度关注两点。
一是数据所反映的对象是否应对所收集数据有一定的权利,如人对自己的生物特征、地理位置、消费和信用等行为特征,是否拥有保密(不被收集,或部分特征不被收集)、处置和“遗忘”等权限。同时,企业法人是否也具有相应权限?
二是数据所反映对象应如何介入数据产业链。利用数据所创造的价值,是否应该以及以多大比例、什么方式分配给反映对象?如企业集团的账户信息,银行和第三方开发利用后,是否需要与企业集团进行一定的利益共享,采取什么方式,通过股权合作还是战略协议等其他方式?
随着数字空间的拓展,还会发展出来完全虚拟的数据活动,如游戏,以及在游戏中的权益(如游戏币等数据)。当然,即使是游戏,也涉及真实的人,只是游戏本身目前还缺乏与现实的直接联系。在现有的认知中,似乎还不是很急迫需要界定游戏中的权利义务与现实世界的权利义务如何对应的问题。这种数据虽然也是一种“数字”,但与要素市场化配置机制文件中“数据要素”谈论的“数据”,并不完全是同一个概念。
3.带上人类普遍“信任”的数据
一般情况下,数据只有在特定算法下才有价值。算法挖掘的是数据隐含的信息,从而体现数据价值。但有一类数据极其特殊,其价值直接源于人类社会或算法赋予的“信任”。
观察金融构建的虚拟空间,广义上金融资产也属于数字空间中的数据,其运作可近似为一种政府背书的、严肃的数字游戏。货币最初以实物形态存在,如贝壳、黄金、银圆等,之后主权国家发行纸钞,以主权背书纸钞的发行和流通。当越来越多经济行为在网络空间发生时,纸钞逐步被银行存款等电子货币取代。电子货币时代,货币通过银行的账户系统,以电子数据形式存在。电子货币的价值,来源于国家法律以及央行、商业银行等金融设施的运作带来的人类普遍信任。
近些年出现的很多数字货币(如比特币、Libra等),是通过区块链技术凝聚并传递数字货币圈内的普遍信任。区块链是借助分布式存储/计算、点对点传输、共识机制和密码学等计算机技术,仅依靠技术就实现了信任在线上的快速转移。区块链技术还在不断演化,但其基本思想至少包括以下三方面:一是非人格化的信任机制,以不可篡改和算法规则补充物、人(机构)和主权信任;二是共同账本(全部参与主体、相关参与主体)代替个别账本,克服了信息的不充分和不对称性;三是具备平台特征,可以兼顾分布式共享和可拓展性需求。
在电子货币、数据货币和金融资产、数字资产等场景中,以特定方式产生的数据,特别是当这种数据被赋予某种权利义务后,将产生巨大的社会价值。价值主要来源于算法(基于区块链的数字货币,如比特币、Libra以及我国央行拟推出的央行数字货币,具有算法赋予的信任基础,但仍链接了人类制度创造出来的信任,属于过渡性货币形态)或者人类制度(如各国的法币体系),数据只是一种“代表”,仿佛数据就是价值。这已不是如何管理数据资源或数据资产的问题,而是如何更有效地利用数据,管理数据背后凝聚的人类普遍信任,进而提高人类合作的效率。