1.5 贵州数据基础设施实践案例
1.5.1 贵州数据基础设施总体框架
贵州省大数据发展管理局和云上贵州大数据产业发展有限公司作为行政和市场的代表两面出击,深入贯彻落实贵州省大数据战略,以高质量建设国家大数据综合试验区为重要方向,以推动贵州数据要素市场构建和数字经济发展为主要目标,加快推动数字治理示范标杆、数据要素开发先导区建设,创新数字化治理模式。
一是在国内率先推行“一云一网一平台”和“四变四统”信息化建设改革创新模式,实现省域政务数据的统筹和自治,有效提升政务数据“汇聚、融通、应用”能力;二是加快全国一体化大数据中心协同创新体系国家枢纽节点(贵州)建设,构建算力和数据流通调度的基础设施和核心枢纽;三是积极探索公共数据开发利用试点,通过构建数据可信流通和开发利用平台实现“数据可用不可见”,推动政府—企业数据安全流通和融合应用,并探索数据要素市场建设。
1.5.2 基础设施层——贵州省一体化大数据中心
全国一体化大数据中心协同创新体系国家枢纽节点(贵州)的建设将以“数网”“数纽”“数链”“数脑”“数盾”建设为重点,构建“五横十纵”的一体化大数据中心体系,在贵州省内部形成省域要素市场枢纽。
贵州省全国一体化大数据中心以“数链”为切入点,加速数据流通融合,加快完善数据资源采集、处理、确权、使用、流通、交易等环节的制度法规和机制化运营流程,通过推动“央—地”“政—企”数据共享对接,深化政务数据共享共用,促进省域数据流通和数据交易,构建省域数据要素市场。同时,“数链”借助数据沙箱、联邦学习等可信技术,强化数据流通交易过程中政务信息、企业商业秘密和个人数据的安全保护,保障数据跨省流通应用,打造国内首个省域数据可信流通试点示范样板。
推动省域政企数据自治,培育省域数据要素市场。推动“央—地”、“政务”和“政—企”数据共享对接,整合各方数据资源汇聚贵州,提高数据交换与共享能力。优化数据综合治理,构建清洗辅助、质量评估和数据资源分级分类管理体系,制定数据分级分类标准,依据标准建立数据资源池,大力提升数据服务能力。
促进数据交易和流通,打造国家级数据要素市场战略节点,探索新型数据交易模式。围绕数据资源产品、数据服务产品、数据权益产品、数据公益产品等不同标的,探索推出成本定价、收益定价、股权定价的交易模式,建立健全数据资源交易机制和定价机制,规范交易行为。构建新型数据交易运营机制,突破贵阳、贵州或西南的地域限制,坚持央地协同、全国布局,完善跨区域全国运营布局体系,打造全国统一的数据要素市场西南枢纽节点。
1.5.3 数据管理层——贵州省“一云一网一平台”
“一云一网一平台”通过构建统一基础设施实现政务信息化系统集约化、共享化建设并提升全省政务数据“聚、通、用”成效。
构建统一基础设施实现省域政务数据的统筹和流通。建立了云上贵州系统平台作为“统筹存储、统筹共享、统筹标准和统筹安全”的全省统一政务云计算平台;采用多网融合技术,构建覆盖省、市、县、乡、村五级的物理电子政务网络,建立了一个安全的网络接入平台;建成省市县一体化政务数据共享开放平台,应用了可信数据智能共享模型,实现省域政务数据的互联互通和共享交换;按照最新的网络安全等级保护制度2.0要求,建立了统一的安全防护能力,确保云上贵州系统平台底座和数据安全合法合规。
通过体系化数据治理实现政务数据的自治。出台《贵州省政府数据共享开放条例》,由省大数据局作为全省政务数据主管部门,建立数据共享交换标准流程,严格执行数据共享交换审批制度,防止政务数据被滥用和非法访问;在国内率先制定并应用数据目录编制、元数据描述、数据分类分级等近20项政务数据地方标准,为“一云一网一平台”新建项目提供统一的数据标准,有效提升政务数据标准化及质量;建立统一政务数据中台,提供元数据、主数据、数据质量、数据标注、数据加工、数据可视化、数据智能搜索等数据治理及分析能力,开展政务数据体系化数据治理,构建形成业务图谱、知识图谱和数据图谱,实现数据与业务和行业属性的深度关联,提升数据的识别、理解和共享、融合功能。
目前,“一云一网一平台”省级主节点物理计算总规模超过3200台服务器,可提供标准配置云服务器52000余台,标准云数据库18000余台,存储空间达38PB,承载了1200余个应用系统的运行,实现省、市、县、乡、村五级78.3万项服务事项网上可查、可办,省、市、县三级政务服务事项网上可办率达100%,累计业务数据量达到12PB。贵州构建了统一用户、统一授权、统一审批、统一数据资源中心的省、市一体化政府数据共享开放平台。目前汇聚发布了90个市直部门、10个市州共13544个数据目录,挂接数据资源8799个,平台累计交换数据2.31亿余批次(8169.69亿余条)。通过数据区提供各部门统一的数据出入口管控和数据治理服务,并基于统一的数据资源池,建设了人口、法人、空间地理、宏观经济4大基础库和信用、一卡通等主题库,目前数据资源池已汇聚数据近100亿条。贵州省政府数据共享开放连续多年处于全国第一梯队。
1.5.4 数据流通层——贵州省数据开发利用支撑平台
探索建立公共数据可信流通的平台和管理机制。实施“一场景一申请、一需求一审核、一场景一授权、一模型一审定”的管理机制,建立“数据供给区、数据加工区、数据开发区、数据运营区”的数据可信流通和安全开发利用平台,实现数据清洗、脱敏、标注、融合和封装的生态化、协作化,形成标准化、定制化、融合化的数据块或数据接口服务,实现模型开发、模型训练和模型运行,利用多方安全计算、联邦学习、区块链等技术融合实现数据“可用不可见,用途可控可计量”,建立数据模型审定、数据产品审定系统,确保数据开发利用的合规性、安全性。建立统一的数据服务和产品交易平台,提供数据申请、服务查询、数据撮合、需求发布、模型超市、产品超市等。
推动政府-企业数据可信流通和安全融合利用。基于公共数据可信流通和安全开发利用平台,推动供电、通信、教育、公共交通等公共企业数据归集,广泛与银行、互联网企业、数据分析挖掘企业开展普惠金融、公共资源交易、文化旅游、交通出行、工程建设、医疗健康等场景的开发应用,推动政府–企业数据可信流通和安全融合利用。
探索数据要素市场自治建设。建设数据运营服务平台,构建数据服务和数据产品超市,探索数据权属、数据服务、数据产品定价和开发利用收益分配、开发利用成效评估、开发利用监督等机制,探索基于一体化数据开发利用和运营服务平台构建省市分级运营机制,建设省域数据要素自治市场。
化解数据确权问题,聚焦数据价值交易。在以数据开发利用支撑平台为核心的大数据生态下,积极探索数据运营模式,将数据变为资产,以服务体现数据价值,不论是中台运营商还是服务提供方都能分享运营收益,为数据经济发展提供持续稳定的数据要素市场。

图1-9 数据运营加工平台框架
目前,在贵州省大数据局统筹下,云上贵州公司已建立多方安全开发利用云平台(数据运营加工平台框架如图1-9所示),作为政务数据资源开发利用的统一“入口”和安全“闸口”,面向开发利用者提供一站式、标准化、规模化的云存储、云计算、云安全、开发工具、模型算法、数据资源等共性服务。平台采用国产区块链——“享链”和鲲鹏信创体系,并利用多方安全计算、可信执行环境(TEE)、联邦学习等计算构建起多元模式的自主可控安全开发利用平台,提供隐私求交、匿踪查询、联合统计等安全计算服务。建立了数据清洗加工车间、数据模型及产品审定平台、开发利用安全监管系统等平台,有效实现数据在输入、加工、建模及输出的全程中安全可控。该平台在普惠金融、公共资源交易、文化旅游、交通出行、工程局建设、劳动就业、医疗健康、农业经济信息服务8大重点领域积极推动了10余个应用场景建设,并推动了电力、燃气交通、电信运营商等公共企业的数据归集与政务数据的融合开发利用。