政策解读

  • 《关于推进行业高质量数据集建设行动的实施方案》政策解读

    2026-06-10

    适用对象:从事人工智能、数据服务、智能安防、低空经济、具身智能等领域的企业

    核心问题:这个政策对AI数据产业有什么影响?企业有哪些机会?

    一、一句话核心:AI的“燃料”问题有了国家方案

    2026年6月,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》(以下简称《实施方案》),系统部署行业高质量数据集建设工作。

    核心目标:到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设工具和标准。

    现状数据:截至2026年第一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB,日均词元(Token)调用量突破140万亿。行业数据仍然存在分散沉淀、质量不高、标准不一、模型适配不强等问题,制约AI在重点行业和复杂场景中的深入应用。

    二、六个专项行动:全链条布局数据集建设

    《实施方案》围绕行业高质量数据集的供给、流通、应用三大关键环节,部署了六个专项行动:

    专项行动核心内容对企业的意义
    强基扩容拓宽数据供给渠道,丰富数据供给类型,聚焦重点领域和创新领域数据资源丰富的企业可成为数据供给方
    标注攻坚培育数据标注龙头企业、独角兽企业、瞪羚企业数据标注企业迎来政策扶持
    提质增效加强数据清洗、增强、质检等关键技术攻关,鼓励仿真合成技术技术驱动型数据服务商受益
    应用赋能打造“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”推动AI应用企业形成数据闭环
    管理服务完善数据治理和标准体系数据管理服务市场空间扩大
    价值释放创新商业模式,探索词元交易等新型交易模式数据要素市场化迎来突破口

    三、与应标网用户直接相关的重点领域

    《实施方案》明确聚焦以下领域加快推进行业高质量数据集建设:

    类别具体领域与应标网用户的关联
    重点领域科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务智能安防、智慧城市、风险监测等领域的数据基础
    创新领域低空经济、具身智能、智能驾驶、智慧海洋、生物制造与安全科技高度相关:低空安全、智能机器人、无人驾驶安全等

    专家观点:低空经济、具身智能、智能驾驶、智慧海洋、生物制造等创新领域对多模态数据、仿真数据、物理交互数据和高精度标注数据需求较强,将带动数据采集、仿真建模、场景测试和模型训练等环节发展。

    四、政策亮点:词元交易开创数据流通新模式

    《实施方案》首次提出“探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据价值体系”。

    什么是词元(Token)?

    词元是AI大模型处理文本的基本单位。在AI训练和推理过程中,数据被分解为词元进行处理。将词元作为数据交易的计量单位,意味着数据价值可以从“按条/按GB”粗放定价,转向“按AI消耗量”精细化定价。

    对企业意味着什么?

    企业类型机遇
    数据资源企业可将数据加工为词元化的数据集,按Token消耗量收费,实现持续收入
    AI应用企业可按实际Token消耗量付费,降低数据获取门槛
    数据服务商可提供词元化数据处理、词元交易平台等服务

    五、政策红利:哪些企业将受益?

    企业类型受益方向政策依据
    数据资源企业成为高质量数据集供给方强基扩容行动
    数据标注企业政策扶持培育龙头企业、独角兽企业、瞪羚企业标注攻坚行动
    技术驱动型数据服务商数据清洗、增强、质检、仿真合成等技术研发获支持提质增效行动
    AI应用企业数据飞轮闭环加速AI模型迭代应用赋能行动
    数据流通平台词元交易等新商业模式探索价值释放行动

    六、与《人形机器人与具身智能实景实训专项行动》的关系

    两份文件均为2026年6月发布的AI产业重磅政策,相互补充、协同推进:

    对比维度《数据集建设方案》(本文件)《人形机器人实景实训专项行动》
    定位AI的“燃料”供给AI的“应用场景+本体”
    核心高质量数据集建设实景实训空间+创新应用联合体
    目标2028年底建成一批高质量数据集2026年底万台级规模落地
    关联为AI模型提供训练数据为机器人产品提供真实场景验证

    两者共同构成AI产业发展的政策支撑体系:没有高质量数据,AI模型无法训练;没有真实场景验证,机器人产品无法落地。

    七、企业行动清单

    优先级行动项建议部门建议时限
    ? 中梳理企业数据资源底数,评估可作为数据集供给的潜力数据管理部/技术部1-2个月内
    ? 中关注数据标注产业扶持政策,积极申报相关认定项目申报部门政策发布后跟进
    ? 低布局数据清洗、增强、质检等关键技术研发技术部中长期规划
    ? 低探索词元交易等新型数据商业模式战略部/创新部中长期规划
    ? 低关注低空经济、具身智能、智能驾驶等创新领域的数据需求市场部持续关注

    八、常见问题(Q&A)

    Q1:中小企业能参与数据集建设吗?

    A:可以。文件明确培育数据标注龙头企业、独角兽企业、瞪羚企业,中小企业可通过技术创新和专业化服务进入政策扶持视野。

    Q2:词元交易什么时候能落地?

    A:文件首次提出这一方向,属于探索性政策,具体落地时间取决于后续细则和试点推进,建议相关企业提前布局研究。

    Q3:这个政策与安全科技企业有什么关系?

    A:智能安防、智能巡检、风险监测预警等应用高度依赖AI模型,而AI模型的性能取决于训练数据的质量和数量。高质量数据集将直接提升安防AI的准确性和可靠性。

    九、总结

    核心要点一句话总结
    数据是AI燃料高质量数据集决定AI创新高度与产业落地深度
    六大专项行动覆盖数据供给、标注、提质、应用、管理、价值释放全链条
    创新领域机遇低空经济、具身智能、智能驾驶等与安全科技密切相关
    词元交易亮点开创数据流通新模式,企业可提前布局
    政策协同与本文件配套的《人形机器人实景实训专项行动》共同构成AI产业政策支撑体系


    本文为应标网政策解读,仅供参考。具体以官方文件为准。



    附:《关于推进行业高质量数据集建设行动的实施方案》全文