点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

【网络强国·百人谈——2026年全国两会特别篇】
观点提要:
■建设高质量数据集至关重要
■数据收集源头缺乏标准化
■完善数据生态支撑体系,提升高质量数据集建设效率
2026年是人工智能与实体经济深度融合加速推进的重要一年,如何夯实人工智能发展的数据底座,成为社会各界关注的热点话题。在2026年全国两会期间,全国政协委员、德勤中国董事会主席蒋颖在接受光明网采访时表示,数据要素正在变成生产要素,需要多方联动,不断提升数据集的质量。
“‘高质量数据集’被写进政府工作报告。我非常受到鼓舞。”蒋颖介绍,当前,人工智能应用到商业场景、产业场景,以及人工智能产业化本身,已经成为重要趋势,并且已经有了很多落地的场景。但要将人工智能大模型真正做成产业垂类大模型,让其与实体经济和实体产业融合,高端、高质量的数据集就变得至关重要。
“我们现在看到的现象是,在收集阶段,很多行业和企业都在收集数据,但在源头基本上没有很多的标准化,使得很多收集相对结构不一致。”为此,蒋颖提出以下建议:
一是要加快构建统一规范的高质量数据集标准体系。通过行业指南和示范案例细化落地路径,引导重点行业对存量数据进行标准化改造,推动同类数据在结构设计、字段定义上对齐,减少重复清洗和格式重构成本,提高复用效率,同时为中小企业提供可直接参考的示范项目和通用模板。
二是完善数据生态支撑体系,提升高质量数据集建设效率。建立数据服务商的国家认证与信用体系,为市场提供权威背书,解决“缺信任”问题。针对数据采集、清洗、标注、维护等环节,向企业提供可直接使用的模板、工具和技术支持。同时,设立专项激励,通过财政补贴、示范项目支持等,降低企业在数据治理、持续更新和合规管理等环节的投入压力。
三是强化应用导向设计,提升数据集实际价值。在立项审批阶段明确要求数据集必须对接具体场景和业务需求,通过指南和操作模板引导企业系统梳理数据使用目标。建设过程中通过阶段性评审和动态监督,确保成果与实际需求匹配。项目完成后建立数据共享和迭代更新机制,将成熟成果纳入公共数据资产或行业数据平台,明确访问权限、使用规则和维护责任,推动数据集实现长期复用、持续迭代和价值释放。
光明网数字化频道&网络安全频道出品
监制:张宁 策划:李政葳 拍摄:雷渺鑫 制作:赵鹏超 包装:曾震宇

“网络强国·百人谈”更多内容
欢迎扫码关注专栏
