一、隐私计算对科技产业的影响
(一)对人工智能产业的影响
隐私计算与人工智能的结合,未来可以使得人工智能突破数据瓶颈,开启新一轮的增长。
1955年,“人工智能”在达特茅斯夏季研讨会被提出。科学家们认为,人类学习的每一方面或智能的任一特征可以被精准描述,提供给机器学习和模拟,从而解决人们做不到的事情。
人工智能发展了60余年,在2015年前后进入高速发展期。传统的人工智能受计算力和数据量的限制,在第三次人工智能浪潮前还没显示出“智能”的特性。直至2006年,“深度学习神经网络”被提出,其性能才获得显著进展,算力满足实际应用需求。伴随着互联网、物联网数据量爆发式的增长,人工智能才能利用海量资源优化模型,真正迈向智能化。
然而,近几年来,由于缺乏可用的数据,人工智能的发展遭遇瓶颈。
一方面,政府和个人对于数据隐私保护的需求日渐增强。随着数据价值的凸显,以及信息泄露丑闻的频发,公众明显感觉隐私泄露的弊端远超过AI本身带来的便利和智能。例如,大数据杀熟导致用户并没有满意的购买体验,反而付出了更多的钱。因此,公众保护隐私的诉求空前高涨。另外,随着欧洲GDPR法案和美国加州CCPA法案的发布、国内《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》的出台,政府对企业的数据流通提出了更严格的规制。
另一方面,企业将数据要素作为核心资产,不愿意在公开透明的环境下共享流通。因此,人工智能企业缺少可用数据优化模型,阻碍了模型精度的进一步提升。
隐私计算技术成为破局之道,可以为AI模型提供多样化的数据资源。
首先,隐私计算技术可以在不归集数据、不泄露隐私的情况下,利用协同算法进行算法训练。人工智能公司在采集、加工、利用数据时,技术保证了多样化数据获取的全周期合规性。
其次,隐私保护技术开拓了人工智能企业在敏感数据行业中的应用。以医疗行业为例,患者的病例和医生的诊断在透明的环境下无法用于模型的学习和训练。但如果AI结合了隐私计算,企业能在不泄露个人隐私的情况下,将大型医疗机构的专家知识和经验聚合并标准化,形成知识图谱和专家决策支持系统。专业的医疗资源也能赋能基层医疗机构。
另外,隐私计算的分布式特征将逐步缓解“数据霸权”的现象。数据产生端和利用端经常因技术实力和资源禀赋的不对等,导致国内数据资源集中在数据巨头手中。一些弱势的新入局者将逐渐丧失对数据的控制权和收益权。人工智能公司也会因为数据资源丰富程度的不一致,导致其产出的模型性能不一。然而,隐私计算技术实现数据不出库,即数据的控制权掌握在拥有方手中。在数据协同生态中,各企业拥有更为精细化的分工,即数据提供方和使用方、算法提供方和算力提供方,不会出现弱势方“无米下锅”的情形。
与此同时,隐私计算和区块链的结合可以为人工智能新领域——边缘AI,解决落地瓶颈。
过去先进的人工智能都是在云端进行的,需要大量的算力,经常导致网络延迟或停机。然而数据传输的滞后对于当代人工智能应用是灾难性的,例如自动驾驶汽车在监测障碍或人群经过时一旦发生停机将造成生命危险。因此,人工智能企业提出实时处理数据的需求,即不连接云平台,在内部设置上完成数据运用,即边缘AI。
以智能农业为例,边缘AI在落地应用时遭遇障碍。当土壤探针采集农业大数据时,如何保证数据真实且不被篡改,如何聚合散落在政府、科研院所、田间地头、产销供应链中各主体的数据库,如何使产业链上各参与方相信最终AI模型处理的结果,这些都是传统人工智能无法解决的问题。
在区块链和隐私计算技术结合之后,能确保原始数据的可追溯和真实可验证性,能对物理分散的数据形成逻辑集中视图,AI模型将有充足的、可信赖的数据来源用于模型训练。因此,区块链与隐私计算技术相结合,可以使AI在农业科学生产、农户信用评估、农业风险预测等多方面发挥更大的价值。
(二)对区块链产业的影响
从技术角度看,区块链技术起源于密码学的小圈子,区块链最初提出的目的,是针对密码学这个圈子里面提出的一个具体问题的解决方案——如何把一笔资产安全、可靠、无可辩驳地从A转给其完全陌生的B。比特币的诞生,就是为了解决这个问题。
区块链技术的这个特性,可以应用于解决数据资产的流转问题。但是,只应用区块链技术,又不能完全解决这个问题。
数据的流通和传统资产的流通有一个关键的不同,那就是数据资产极容易被第三方复制和泄露,造成价值的明显降低。区块链能够解决的问题是,在数据流通过程中,区块链可以记录整个过程中牵扯到的人的行为属性,以及数据本身在这个过程当中所经历的变化。然而数据本身的加密和安全,现有的区块链技术并不能完全解决。
隐私计算技术能解决上链数据的安全和隐私保护问题,帮助区块链行业落地信息敏感的场景。而技术的使用方,即需要保护敏感数据的企业,也获取了一条对外提供可信数据、挖掘数据背后价值的渠道。
以安全生产企业的风险定价为例。在国内,化工、煤炭等高危行业屡次发生爆炸、泄露等事故,造成严重的人员伤亡。一般来说,企业需要通过购买保险来支付事故发生后给付员工的赔偿金。但是,大部分保险公司不愿意为他们提供保险,因为不相信安全生产企业提供了真实的风险数据。相比于系统内部纸面上的数据,保险公司更加信任链上实时记录的数据,其生成、变化、消失的每一步能被保险公司实时监控。基于可验证的数据,保险公司才能精确地衡量企业背后真实的风险,从而售卖对应的保险产品。因此,安全生产企业必须使用区块链技术。然而,安全生产企业担忧风险相关的数据以明文形式上链,并永久储存;保险公司也不愿意透露内部的精算公式。基于双方的需求,隐私计算技术的融合变得必要。安全生产企业输入敏感数据后,隐私计算平台将数据以加密形式呈现、储存和流通,保险公司通过密钥只能获得指定的信息;保险公式的精算公式也在隐私环境中运行,安全生产企业只能获得加密后的输出结果而无法反推数据的计算模型。
隐私计算技术除了为区块链提供隐私环境之外,其数据处理能力降低了中小机构加入联盟链生态的门槛,丰富了数据资源。
由于联盟链为各参与方提供数据的记账功能,各参与者需要具备运维链上节点的能力。然而,以金融行业为例,并非所有金融机构都具备所需的IT运维能力,他们便寻求有隶属关系、具备管理能力的第三方企业托管节点。问题是,数据存储的节点可以无限分散,但数据协作时需要通过计算聚合产生价值。区块链技术的计算能力有限,无法实现,需要由隐私计算技术完成。随着隐私计算技术聚合各节点上密文形式的数据,更多不具备节点管理能力的机构也能参与联盟链生态,进一步扩大了数据资源的范围。
另外,随着链上数据资源的丰富,隐私计算技术弥补了区块链在储存和计算能力上的不足。
区块链架构分为两层,第一层主要包括数据层、共识层、激励层,第二层包括合约层和应用层。第一层的主要作用是确保网络安全、去中心化及最终状态共识。第二层的储存能力不被共识束缚,因此为第一层承担了大部分储存和计算工作,随后通过锚定关系将计算输出传递至链上,不影响区块链的记录功能。
当前大部分区块链应用在第二层运行,企业不愿上链的敏感数据也大部分堆放在第二层。现实是,区块链第二层也难以同时支持大量数据的储存和应用运行。隐私计算环境相较区块链架构具有更大的空间和更强的计算能力,因此能够进一步承担第二层数据存储和处理的压力。
最后,区块链和隐私计算的结合是实现可信数据流通成本最低、最高效的方式。
对于数据多方协作,隐私计算技术虽然能解决加密和计算,但缺乏安全校验的流程。即使参与多方曾经开展过多年的商业合作,其信任程度也仅止于联盟链节点的搭建,而不会分享原始数据。如果没有区块链技术的帮助,企业无法证明数据是否出库、是否经隐私计算模型处理,进而无法审计和监管。另外,纯隐私计算技术加持的数据流通的激励机制是模糊的,数据拥有方无从得知数据究竟创造了多少收益、分配依据是什么,因此无法获取公平的激励。区块链更加透明,详细记录了加密数据的出库、上链、流转、存储等各个环节。数据具体产生的价值对参与方公开,且能通过智能合约自动分配到数据的提供方、商业撮合方等所有个体。
因此,对于数据资产的流转来讲,没有隐私计算,就不能解决数据本身的安全和隐私保护问题;没有区块链,则不能解决数据的确权问题。区块链和隐私计算二者结合,是目前能够看到的建设大规模数据流通网络的途径之一。
(三)对大数据产业的影响
隐私计算将重塑大数据产业。
一方面,隐私计算技术是大数据行业处理数据合法化的刚需。《中华人民共和国数据安全法》强调,产业需要平衡数据安全与应用发展。隐私计算将成为平衡的关键技术支点。隐私计算致力于为数据获取、共享、利用提供全周期的安全保障,搭建各类数据的隐私协作基础,降低了数据泄露的风险和明文数据留痕造成的价值递减风险。
另一方面,随着数据流通的安全化,以往较为敏感的数据领域逐渐开放。以政务数据为例,隐私计算使联合政务、企业、银行等多方数据建模和分析成为可能,进一步释放数据应用价值,创造了多样化的应用机遇。