二、数据要素整体发展与治理现状
近年来,我国数据规模急剧增加,除了生活类数据资源,公共服务类、行业类数据资源也不断积聚。例如,互联网应用、智慧城市、电子政务服务、企业上云等带来的数据量极其庞大。数据中心建设如火如荼,数据共享开放与利用积极推进,数据助力地方产业数字化渐次加速,数据治理逐渐突破。
(一)我国成为数据资源大国
据国际数据公司IDC测算,2018 年中国数据圈占全球数据圈的23.4%,即 7.6ZB。预计到 2025 年将增至 48.6ZB,占全球数据圈的27.8%,中国将成为全球最大的数据圈 。白皮书将数据圈定义为每年被创建、采集或是复制的数据集合。因此,数据圈其实就是每年产生的数据的集合。由此可见,我国已成为数据资源大国。另外,据中国互联网络信息中心(CNNIC)数据显示,截至 2020 年 3 月,我国网民规模为 9.04 亿,互联网普及率达 64.5% 。庞大的网民、丰富的互联网应用带来了规模巨大的数据量。随着移动互联网的快速发展,大众出行、社交娱乐、通信购物、教育医疗等日常生活开始离不开各类手机App。从线下到PC线上,从PC线上到手机线上,个人信息采集获取的渠道更广、难度更低,数据资源也正变得维度更丰富、规模更庞大。但是,显然,我国还不是数据资源强国,涵盖数据采集、加工、管理、分析和应用全链条的大数据产业生态体系还需要加大力度培育。
(二)新基建“东风”带动数据中心建设
国家高度重视数据中心建设,释放积极政策信号。2020 年 3 月 4日,中央政治局常务委员会会议强调,要加快 5G网络、数据中心等新型基础设施建设进度,要注重调动民间投资积极性。4 月 1 日,习近平总书记在浙江考察时再次强调,要抓住产业数字化、数字产业化赋予的机遇,加快 5G网络、数据中心等新型基础设施建设。4 月20 日,国家发改委首次明确新型基础设施的范围,三类新型基础设施之一的信息基础设施即包含以数据中心、智能计算中心为代表的算力基础设施。新基建迎来新机遇,数据中心建设必将乘势而起,建设规模将非常庞大。
地方政府超前布局,推动数据中心建设。2020 年 3 月 5 日,广西印发《广西基础设施补短板“五网”建设三年大会战总体方案(2020—2022 年)》,提出要建成 60 个以上自治区级大数据重点支撑平台,全区数据中心承载能力达到 50 万架标准机架。3 月 19 日,山东省印发《山东省数字基础设施建设指导意见》,提出“2022 年底在用数据中心机柜数达到25万架”等一系列目标和要求。5月7日,《上海市推进新型基础设施建设行动方案(2020—2022 年)》正式发布。到 2021 年第一季度前,上海将新增 6 万数据中心机架供给,直接投资约120亿元,将带动投资超过380亿元。
企业真金白银投入,力促数据中心项目落地。互联网企业积极响应国家号召,快速做出反应。2020 年 6 月 6 日,腾讯长三角人工智能超算中心及产业基地项目在上海松江正式开工,预估投资超过450亿元,占地 236 亩。该超算中心将成为长三角最大、全国前三的人工智能超算枢纽,预计 2021 年底陆续投入使用,将承担各种大规模AI算法计算、机器学习、图像处理、科学计算和工程计算任务。6月19日,百度宣布未来十年将继续加大在人工智能、芯片、云计算、数据中心等新基建领域的投入,预计到 2030 年百度智能云服务器台数将超过500万台,根据市场测算,约等于3000亿元人民币加码新基建。
(三)数据共享开放应用稳步推进
政府数据共享方面,2016 年 9 月发布的《国务院关于印发政务信息资源共享管理暂行办法的通知》(国发〔2016〕51 号)要求,各部门业务信息系统应尽快与国家数据共享交换平台对接。自2017年,《国务院办公厅关于印发政务信息系统整合共享实施方案的通知》(国办发〔2017〕39 号)、《国务院办公厅关于印发国务院部门数据共享责任清单(第一批)的通知》(国办发〔2018〕7 号)陆续出台,进一步明确了数据共享要求。2019 年,国家数据共享交换平台提供受理服务8622次,同比增长102.39%,平台和各部门共授权7265次,同比增长 142.65%。31 个国务院部门在国家共享平台注册发布实时数据共享接口1153个,约1.1万个数据项,涵盖个人身份、出生、教育、婚姻、社保等自然人相关信息,企业基本信息、信用信息、资质信息等法人相关信息 。
政府数据开放方面,2017年2月十八届中央深改组第三十二次会议审议通过《关于推进公共信息资源开放的若干意见》,这是我国第一次对公共信息资源开放和利用进行顶层设计。2018 年 1 月 5 日,中央网信办、国家发展改革委、工业和信息化部联合印发了《公共信息资源开放试点工作方案》,确定在北京、上海、浙江、福建、贵州开展公共信息资源开放试点。从国家部门数据开放与利用看,少数部门已建设了数据开放平台。交通领域是当前国内数据开放和应用最重要的领域,交通数据的商业和社会价值非常高。2016 年 11 月,交通部“出行云”综合交通出行大数据开放云平台上线,迈出国家部门数据开放征途上的一小步。截至 2020 年 7 月,平台上开放的数据集有 195 个,其中原始数据集共 161 个,开放数据较多的是班线客运、地面公交、高速公路等领域,分别开放了 42 个、33 个和 31 个数据集 。
从地方政府数据开放与利用看,上海、北京、广东、贵州等地已经开展了诸多探索。据数据显示,截至 2019 年 10 月,我国已有 102个省级、副省级和地级政府上线了数据开放平台,平台总数首次超过100个 。与2019年上半年相比,新增20个地方平台。我国51.61%的省级行政区、66.67%的副省级和24.21%的地级行政区已推出了政府数据开放平台。地级以上平台数量逐年翻番,从2017年的20个,到2018年的56个,再到2019年的102个,“开放数据,蔚然成林”已从愿景成为现实,政府数据开放平台已日渐成为一个地方数字政府建设的“标配”。在数据开发利用上,目前被利用的数据集数量较少,主要来自交通运输、统计、教育、市场监管、人力资源和社会保障、农业农村、公安、卫生健康和文化旅游等9类政府部门。
(四)数据要素助力地方产业转型发展
数据要素正不断加速地方产业数字化转型发展进程。数据要素对传统产业中的研发设计、生产制造、经营管理、销售服务等环节会产生重要影响,能够为传统生产型企业提供从生产到运行的全流程大数据分析能力,提升中小企业在资源、能力、信息共享方面的深层应用,加快制造企业转型升级、创新商业模式、推进供给侧结构性改革。2019 年我国产业数字化增加值规模约为 28.8 万亿元,2005年至 2019 年复合增速高达 24.9%,显著高于同期GDP增速,占GDP比重由2005年的7%提升至2019年的29.0% ,产业数字化加速增长,成为国民经济发展的重要支撑力量。各行业数字化转型需求与日俱增,智能制造、智慧交通、智慧仓储、产业链协同等领域在数据要素的作用下亮点不断、规模持续壮大。
地方产业发展对数据需求巨大,且数据要素的地位也在不断提升。地方开展招商时,对接的企业均想获取当地数据资源或者建立与当地政府、事业单位的对接渠道。对于地方政府来说,主要的方式就是建立大数据平台汇聚公共服务数据资源,逐步引入社会数据资源,再以数据资源来吸引第三方企业开展创新应用,不过实际上后面这两个环节是难以落地的。目前,已有地方尝试数据招商,这也是近年来各地发展地方数字产业的探索性招商策略。为何是探索,因为实际执行难度大,蓝图美好,但也有不可预估性。实际执行过程,企业还是围绕政府所掌握的,且部分公开的、动态性不甚理想的、与民众经济社会生活有一定距离的公共服务领域数据。
(五)数据治理工作呈现积极态势
个人信息采集治理步入正轨,有效规范互联网平台对用户信息的采集。长期以来,数据被过度采集的问题一直是社会关注的热点。例如,App后台悄悄收集用户信息时有发生,造成用户个人信息泄露。不少App通过非法、违规收集用户个人信息牟利。但是,此前国家一直没有相关法规条例认定如何才算是违法违规收集信息,这给处罚造成了困难。2019年1月25日,中央网信办、工业和信息化部、公安部和国家市场监管总局等四部门联合发布《关于开展App违法违规收集使用个人信息专项治理的公告》,决定自2019年1月至12月,在全国范围组织开展App违法违规收集使用个人信息专项治理。同年 11 月 28 日,国家互联网信息办公室秘书局、工业和信息化部办公厅、公安部办公厅、国家市场监管总局办公厅联合印发《App违法违规收集使用个人信息行为认定方法》,界定了App违法违规收集使用个人信息行为的六大类方法。
近些年,我国在数据治理领域加速推进立法工作,逐渐填补制度漏洞。2020 年 5 月 28 日,第十三届全国人民代表大会第三次会议通过了民法典,这是一部具有里程碑意义的法律。民法典在人格权编中将隐私权和个人信息保护作为单独章节进行具体规定,体现了当前我国对保护隐私和个人信息的高度重视。7 月 3 日,第十三届全国人大常委会第二十次会议对《中华人民共和国数据安全法(草案)》进行了审议。主要内容包括:确立数据分级分类管理以及风险评估、监测预警和应急处置等数据安全管理各项基本制度;明确开展数据活动的组织、个人的数据安全保护义务,落实数据安全保护责任;坚持安全与发展并重,规定支持促进数据安全与发展的措施;建立保障政务数据安全和推动政务数据开放的制度措施。数据安全法将与网络安全法和正在制定的个人信息保护法等做好衔接。按照全国人大常委会立法规划和年度立法工作计划的安排,全国人大常委会法工委会同中央网信办正在抓紧个人信息保护法草案起草工作,争取尽早提请全国人大常委会审议。