政策解读
-
《关于推进行业高质量数据集建设行动的实施方案》政策解读
2026-06-10
适用对象:从事人工智能、数据服务、智能安防、低空经济、具身智能等领域的企业
核心问题:这个政策对AI数据产业有什么影响?企业有哪些机会?
一、一句话核心:AI的“燃料”问题有了国家方案
2026年6月,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》(以下简称《实施方案》),系统部署行业高质量数据集建设工作。
核心目标:到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设工具和标准。
现状数据:截至2026年第一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB,日均词元(Token)调用量突破140万亿。行业数据仍然存在分散沉淀、质量不高、标准不一、模型适配不强等问题,制约AI在重点行业和复杂场景中的深入应用。
二、六个专项行动:全链条布局数据集建设
《实施方案》围绕行业高质量数据集的供给、流通、应用三大关键环节,部署了六个专项行动:
专项行动 核心内容 对企业的意义 强基扩容 拓宽数据供给渠道,丰富数据供给类型,聚焦重点领域和创新领域 数据资源丰富的企业可成为数据供给方 标注攻坚 培育数据标注龙头企业、独角兽企业、瞪羚企业 数据标注企业迎来政策扶持 提质增效 加强数据清洗、增强、质检等关键技术攻关,鼓励仿真合成技术 技术驱动型数据服务商受益 应用赋能 打造“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮” 推动AI应用企业形成数据闭环 管理服务 完善数据治理和标准体系 数据管理服务市场空间扩大 价值释放 创新商业模式,探索词元交易等新型交易模式 数据要素市场化迎来突破口 三、与应标网用户直接相关的重点领域
《实施方案》明确聚焦以下领域加快推进行业高质量数据集建设:
类别 具体领域 与应标网用户的关联 重点领域 科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务 智能安防、智慧城市、风险监测等领域的数据基础 创新领域 低空经济、具身智能、智能驾驶、智慧海洋、生物制造 与安全科技高度相关:低空安全、智能机器人、无人驾驶安全等 专家观点:低空经济、具身智能、智能驾驶、智慧海洋、生物制造等创新领域对多模态数据、仿真数据、物理交互数据和高精度标注数据需求较强,将带动数据采集、仿真建模、场景测试和模型训练等环节发展。
四、政策亮点:词元交易开创数据流通新模式
《实施方案》首次提出“探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据价值体系”。
什么是词元(Token)?
词元是AI大模型处理文本的基本单位。在AI训练和推理过程中,数据被分解为词元进行处理。将词元作为数据交易的计量单位,意味着数据价值可以从“按条/按GB”粗放定价,转向“按AI消耗量”精细化定价。
对企业意味着什么?
企业类型 机遇 数据资源企业 可将数据加工为词元化的数据集,按Token消耗量收费,实现持续收入 AI应用企业 可按实际Token消耗量付费,降低数据获取门槛 数据服务商 可提供词元化数据处理、词元交易平台等服务 五、政策红利:哪些企业将受益?
企业类型 受益方向 政策依据 数据资源企业 成为高质量数据集供给方 强基扩容行动 数据标注企业 政策扶持培育龙头企业、独角兽企业、瞪羚企业 标注攻坚行动 技术驱动型数据服务商 数据清洗、增强、质检、仿真合成等技术研发获支持 提质增效行动 AI应用企业 数据飞轮闭环加速AI模型迭代 应用赋能行动 数据流通平台 词元交易等新商业模式探索 价值释放行动 六、与《人形机器人与具身智能实景实训专项行动》的关系
两份文件均为2026年6月发布的AI产业重磅政策,相互补充、协同推进:
对比维度 《数据集建设方案》(本文件) 《人形机器人实景实训专项行动》 定位 AI的“燃料”供给 AI的“应用场景+本体” 核心 高质量数据集建设 实景实训空间+创新应用联合体 目标 2028年底建成一批高质量数据集 2026年底万台级规模落地 关联 为AI模型提供训练数据 为机器人产品提供真实场景验证 两者共同构成AI产业发展的政策支撑体系:没有高质量数据,AI模型无法训练;没有真实场景验证,机器人产品无法落地。
七、企业行动清单
优先级 行动项 建议部门 建议时限 ? 中 梳理企业数据资源底数,评估可作为数据集供给的潜力 数据管理部/技术部 1-2个月内 ? 中 关注数据标注产业扶持政策,积极申报相关认定 项目申报部门 政策发布后跟进 ? 低 布局数据清洗、增强、质检等关键技术研发 技术部 中长期规划 ? 低 探索词元交易等新型数据商业模式 战略部/创新部 中长期规划 ? 低 关注低空经济、具身智能、智能驾驶等创新领域的数据需求 市场部 持续关注 八、常见问题(Q&A)
Q1:中小企业能参与数据集建设吗?
A:可以。文件明确培育数据标注龙头企业、独角兽企业、瞪羚企业,中小企业可通过技术创新和专业化服务进入政策扶持视野。
Q2:词元交易什么时候能落地?
A:文件首次提出这一方向,属于探索性政策,具体落地时间取决于后续细则和试点推进,建议相关企业提前布局研究。
Q3:这个政策与安全科技企业有什么关系?
A:智能安防、智能巡检、风险监测预警等应用高度依赖AI模型,而AI模型的性能取决于训练数据的质量和数量。高质量数据集将直接提升安防AI的准确性和可靠性。
九、总结
核心要点 一句话总结 数据是AI燃料 高质量数据集决定AI创新高度与产业落地深度 六大专项行动 覆盖数据供给、标注、提质、应用、管理、价值释放全链条 创新领域机遇 低空经济、具身智能、智能驾驶等与安全科技密切相关 词元交易亮点 开创数据流通新模式,企业可提前布局 政策协同 与本文件配套的《人形机器人实景实训专项行动》共同构成AI产业政策支撑体系 本文为应标网政策解读,仅供参考。具体以官方文件为准。