2.2 数据交易平台发展历程
世界经济论坛(World Economic Forum)于2011年启动了一项名为“重新思考个人数据”(Rethinking Personal Data)的项目,旨在汇集个人、公司、公共部门、学术机构等,探索如何形成一个平衡、互相协作、自律的基于个人数据的生态系统,并发布题为《个人数据:新资产的崛起》的报告,将个人数据作为“最新的经济资源”,列为“新的资产类别”,开展数据治理工作。安全可信的数据共享与交易在国内外工业界已经引起了广泛关注。有以政府部门为主导的公共数据共享开放平台,如美国政府数据开放平台与上海大数据中心等;也有以互联网公司为主体的数据共享与交易平台,如美国亚马逊AWS Data Exchange平台以及国内的数据堂等。下面将回顾国内外工业界数据交易平台的发展现状。
(1)国外数据交易平台
国外数据交易平台如图2-1所示。

图2-1 国外数据交易平台
早期国外的数据交易平台交易的数据类型较为单一。例如,2008年创立的Factual,致力于出售地理位置相关数据集;2009年创立的InfoChimps主要负责出售地理位置、社交网络数据。InfoChimps和DataMarket获得了高额的融资,最后由于成熟的商业模式分别被大型数据分析服务提供商CSC和Qlik收购。还有一些公司,比如Quandl、Benzinga、Airex、Diliger等,专注于提供金融类数据服务,帮助企业做商业决策。我们还注意到由于感知数据量的快速增长,有一些公司,比如Terbine、ThingSpeak和Tingful已经开始涉足感知数据交易市场的构建。最近,世界上最大的加密货币之一IOTA宣布建立物联网数据交易市场,用IOTA货币来支持物联网数据交易。近几年,涌现的数据交易公司不再局限于单一数据出售服务,而是由原始数据交易逐渐向基于数据的有偿服务转型,这是数据共享与交易的必由之路,这也是数据商品区别于传统商品的特性决定的。
美国亚马逊公司于2019年11月提出了面向云计算服务数据交易中心(Data Exchange)的解决方案,通过整合各方权威的数据源,亚马逊云用户能够轻松、安全地查找、订阅和使用云中的第三方数据。提供的数据产品涵盖各个行业,包括金融服务、医疗保健、地理空间等,用户能够通过API接口或者控制台将订阅的数据导入云计算平台,如Amazon S3。为了保护用户隐私,目前亚马逊平台禁止共享敏感个人数据(如个人健康信息)。隐私数据往往具有较高的商业价值,如何可信安全地共享个人隐私数据是数据共享平台亟待解决的问题。
(2)国内数据交易平台
国内数据交易平台如图2-2所示。

图2-2 国内数据交易平台
国内数据市场的发展也是方兴未艾,贵阳大数据交易所是国内第一家大数据交易所。在此之后,国内的大数据交易所如雨后春笋般出现了大小70多个,代表性的包括上海数据交易中心、中关村数海大数据交易平台、武汉东湖大数据交易中心等。同时,以数据堂、京东万象、发源地、聚合数据等在内的以电商模式运营的数据交易平台也纷纷成立。贵阳大数据交易所是国内关于数据交易的首次尝试。截至2016年3月1日,交易所已经成功接入了100多家数据源公司,可交易数据超过50PB,交易数据的范围涉及政府、金融、企业、医疗、电商、交通、社会等30多个领域。但关键技术的探索存在不足,这使得原始数据的合法性难以确定、交易价格的确定不够透明,容易产生数据质量以及数据价格纠纷给大规模落地应用造成了阻碍。数据堂运营国内第一家大数据电商平台,于2011年成立,专注于互联网电商模式的数据交易和服务,致力于融合和盘活各类大数据资源,特别是人工智能相关数据,推动相关数据处理技术、应用和产业的创新,包括数据标注、数据定制和数据训练集等业务。前期数据商城的发展目标是成为中国的“数据淘宝”,但由于数据来源、权属、质量、定价、安全保护及隐私等方面存在一些难题,2017年6月公司又受到泄露客户隐私事件的影响,数据商城业务发展停滞,商业模式仍有待完善。华为技术有限公司于2017年推出了华为大数据统一数据治理平台(unified data governance platform,UDGP),提供全面高效的数据资产治理与管控环境,实现数据管理和共享平台,包括数据采集、整合、安全、标准、生命周期和质量管理以及多维度数据云图等功能,为电信运营、电子政务、智慧城市等提供数据管理支撑。阿里云也推出了数加平台,提供了包年包月付费和按数据交易量付费两种数据定价模式,并在2017年5月对其所提供的大数据产品,包括数据基础服务、数据分析及展现、数据应用和机器学习模型训练等,以地区定价方式进行了详细更新,提供了用户可自行估算大数据产品价格的价格估算服务。
国内外的数据交易市场目前尚未形成成熟的数据交易定价机制。数据价格受多种因素影响,包括数据数量、数据品种、完整性、实时性等的影响。现有大数据交易平台采用的大数据交易定价策略包括平台预定价、自动计价、拍卖式定价、自由定价、协议定价、捆绑式定价等。