7月2日至5日,2025全球数字经济大会在京召开。首都信息发展股份有限公司数据总监崔晓峰在接受专访时表示,推动数据要素与AI共生需聚焦三大核心,即构建全国互联互通的数据流通基础设施,打造基于数字合约和管理共识机制的可信数据空间以保障安全流通,建设面向人工智能的高质量数据集。目前首信已在金融、医疗领域实现“可用不可见”的敏感数据应用试点,并通过在线协作平台促进生态共建。
新华网:首信在本届大会上重点关注哪些与数据要素、AI+相关的议题?
崔晓峰:我们主要关心三个方面的议题:第一个是数据流通基础设施的建设,这是整个数据要素的基础;第二方面就是关于可信数据空间的建设,包括行业可信数据空间以及企业可信数据空间的建设;第三个议题就是关于高质量数据集的建设,助力AI的发展。AI发展到哪个领域,高质量数据的建设就到哪里去,所以高质量数据质量和AI其实是相辅相成的,是一个互相促进的过程。
新华网:您对大会在推动数据基础制度建设方面有何期待?
崔晓峰:第一是,希望大家在基础设施建设上形成一些共识,包括业务节点和区域功能节点的互联,全国的跨域跨链的互联互通,形成真正“立足北京,面向全国“的数据基础设施;第二是,期待各行各业能够把自己所拥有的高价值、高质量的数据集,在基础设施上流通起来,形成活跃的市场主体;第三是,希望生态企业能够加入进来,包括数据集的供方、需方、数据开发方、模型开发者、增值服务的提供方等,共同建设繁荣的生态。
新华网:行业高质量数据集建设面临哪些挑战?首信有哪些实践经验?
崔晓峰:高质量数据建设是个系统工程,面临的挑战包括:首先是顶层设计的缺失,导致数据资源体系建设碎片其次是行业标准的缺失,阻碍数据的流通和交互;第三是海量数据场景下的性能、安全与并发问题。我们的实践包括:首先对数据资源体系顶层规划设计,明确数据从采集到应用的全生命周期路径;其次建立端到端的数据标准体系,覆盖数据分类分级、质量评估等关键环节;最后通过AI驱动的数据治理能力和分布式处理架构,解决高频场景下的数据治理难题,形成从数据供给到需求的闭环管理。
新华网:行业可信数据空间落地存在哪些难点?首信如何解决?
崔晓峰:核心挑战在于两个方面:一是数据安全交互机制,需要保障数据按照数字合约进行流通和交付;二是生态共创环境建设,需要支持多方在线协作开发。我们的解决方案是:通过数字合约技术实现数据安全交付,配套建立管理共识机制,形成技术可信与管理可信的双重保障;同时构建在线协作平台,提供数据标注、数据开发、模型开发、训练、验证的全流程环境,并深度融入行业业务知识,确保数据价值在垂直场景中落地。目前已在金融、医疗、数字文化等多个领域完成试点,实现敏感数据“供得出、流得动、保安全”。