“沉睡”数据变“黄金”!广州城市可信数据空间上线
在数字经济浪潮中,中国正面临“数据富矿”的开发困境:2023年,我国数据生产总量达32.85ZB(泽字节),但仅有2.9%的数据被保存。存储数据中一年未使用的数据占比约四成。与此同时,国际研究机构预测,数据流动量每增加10%,将带动GDP增长0.2%,数据流动对各行业利润增长的平均促进率为10%左右。

如何唤醒“沉睡”数据,成为时代命题。4月17日,广州城市可信数据空间上线,首批囊括了广州12个优势产业的37个高价值场景,并遴选发布首批16家企业的28个高质量数据集,以城市实践探索数据流通困境破局路径。
公共数据引领,产业专区协同
可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施。广州城市可信数据空间采用“1个城市枢纽+N个产业专区”模式,最大程度发挥公共数据的引领作用,带动各产业专区协同推进。
“通俗来讲,广州城市可信数据空间通过城市与产业、产业与企业之间的链接,‘盘活’许多原本‘沉睡’在角落、未能进入流通领域的数据,进而带动整个城市经济的发展。”广州数据集团首席数据官刘国庆告诉记者。
虽然道理看似简单,但可信数据空间的建设需要攻克诸多难题。广州市政务服务和数据管理局局长黄津介绍,广州城市可信数据空间一方面对数据空间内的主体身份、数据资源、产品服务等进行严格可信认证,实现全过程动态监管、实时存证及结果追溯,保障各方合法权益;另一方面需要建立共识规则,增强数据流通和交易意愿,提升决策效率和市场响应速度。
当前,广州城市可信数据空间首批涵盖绿色低碳、医疗健康、交通运输等12个产业专区,覆盖37个高价值场景,全面覆盖城市精细治理和产城融合发展的主要方面,为数据驱动城市发展提供了丰富的应用场景和实践路径。
高质量数据集发布,激活产业创新引擎
如果说城市可信数据空间是数据流通的“基础设施”,那么高质量数据集就是城市可信数据空间的“血液”。广州城市可信数据空间上线当天,16家企业的28个高质量数据集公布。这些数据集涉及生物医药与健康、软件与互联网、智能装备与机器人、现代金融、现代商贸等12个重点产业领域。
南方医科大学珠江医院是首批参与广州城市可信数据空间建设的数据提供方之一,发布了癫痫、阿尔茨海默、意识障碍、儿童脑肿瘤四个专病数据集。“这四个专病数据集覆盖当前医疗领域热点病种,人群覆盖广,治疗阶段全面。它的应用范围包括临床科研、疾病预防和公共卫生决策。”南方医科大学珠江医院副院长张鹏说。

张鹏还提到,在广州城市可信数据空间上线前,他们对于数据共享存在非常大的顾虑。如今,借助这个平台,数据可以在经过脱敏处理与标准化清洗的前提下,安全地进行共享与加工,让数据真正服务于患者和城市健康治理。
广州云蝶科技有限公司是南方医科大学珠江医院数据集的需求方。企业副总裁罗崇键介绍,云蝶科技计划利用这次合作机会打造垂类医疗大模型,包括支持医学领域的教学教研,作为科研助手帮助医生提高科研水平,进一步辅助医生进行疾病诊断,推动医疗服务更精准高效,为患者提供更好诊疗体验。
“我们对高质量的数据集需求十分迫切。虽然市面上也有医疗数据集,但不够全面,非常零散。广州城市可信数据空间搭建,为我们提供安全合规数据流通环境,降低数据获取成本与风险,利于整合多方数据,加速模型迭代升级,促进医疗AI技术创新,助力企业开拓业务、打造更优质医疗产品。”罗崇键说。
广州深耕探索,破解数据流通难题
事实上,广州在破解数据流通中的“不愿用”“不会用”“不敢用”难题方面,早已展开深入探索。2024年,广州率先发布对标数字中国建设的《数字广州建设总体规划》,出台地方性法规《广州市数据条例》,搭建起“1+1+1+N”数据制度体系,全面规范数据全生命周期管理。同年,广州正式启动公共数据授权运营管理,开展了不同领域近70款数据产品和服务的供需对接工作。在广州市区两级公共数据的基础上,采取龙头企业数据融合、部委回流数据协同等多种形式,最大限度实现数据汇聚,为应用场景的快速落地提供充足的数据资源保障,确保数据能够及时、精准地服务于城市发展的各类需求。
“接下来,我们将全力推动城市可信数据空间与高质量数据集的建设,引领城市迈向数字化和智能化。”黄津表示,通过前期广泛征集,目前已有160余家单位表达了参与可信数据空间建设的意愿,并提交了170余个高价值场景。此次上线发布的城市可信数据空间只是第一批成果,未来将基于这些丰富的场景资源,持续激活带动各生态主体,不断扩大产业专区和高价值场景的数量,形成可持续发展的数据生态。
文|记者 李焕坤 通讯员 穗政数宣图|通讯员提供