64个地方数采中心，人形机器人最大的买家

年中复盘，发现错过了不少机会。

最典型的是某灵巧手项目。All in具身的朋友应该很熟——估值从2亿人民币，到20亿，再到现在60亿美元，一年涨了将近二十倍。

更有意思的是它的收入结构：2025年营收不到3亿人民币。

客户都是谁啊？

很有意思，不是本体厂，不是模型公司，是遍布全国的地方数据采集中心。

一、64个数采训练场，撑起了大半个具身产业

根据公开资料，截至2026年4月，全国运营或规划中的机器人数据采集中心已超过90个，约64个已正式投入使用，部分单点部署超过100台机器人。浙江、江苏、广东三省最集中，合计超30个。

运作逻辑是：国资/地方政府建中心、买本体/数采设备、招人采数据，再把数据卖给机器人厂商或数据服务商。

搞土地建工厂是国资最熟的事，拉就业搞产业落地是地方最愿意干的事，本体和模型公司负责出货和买数据。

看起来各取所需。但有个结构性问题值得注意：这个链条的增长，主要是由政策驱动，不是终端需求。

二、数据缺口到底有多大

大语言模型的训练数据量级是10的13次方；自动驾驶头部拥有百亿~千亿小时真人真车真路数据；而具身，我的朋友，训练数据是万小时级（有高有低）。机器人规则更加复杂，规模化落地，需要的比这些要多得多。行业公认的说法：所需与自动驾驶相差约100万倍左右。

现在，全行业目前的存量，估计只有几十万小时，和自动驾驶差的0我都数不过来了。

跟自动驾驶对比，就清楚有多难了。

特斯拉的数据是自己跑出来的，路上的tesla越多，数据越多，已有的100亿英里还在转数据飞轮。

机器人没这条件，工厂产线的数据用不到商超的，商超的用不到医院的，同一工厂不同工位可能都要重新采。

没有数据飞轮，只能靠人力逐个场景去堆。

采集效率也是硬伤。主流遥操作方案，一个人一小时大约最多产出一小时的有效数据，没有规模效应。其他数采方式，有效率仅仅50%。

所以才会遍地数采中心——数据不够，钱就得继续往里砸。

三、数据基建最先赚钱

数采中心大规模建设，直接带热了具身数据公司的融资。

2026年上半年，这个赛道的融资密度明显高于其他细分方向。

部分头部数据公司估值在几个月内翻倍，光轮近200亿；今年闻到味道刚创立的几个创业公司也已close融资，如千帧、intime等等。同时自动驾驶时代的老牌数据标注公司也在加速转型。

整条产业链里，数据是唯一确定会被持续消耗的东西。不管最后跑出来的是哪家机器人，训练数据都得买，数据公司稳赚。

四、坑也是有的

大规模建设的另一面，是数据质量问题开始暴露。

早期目标是"把量堆上去"，但堆着堆着发现：低质量数据不只是没用，训练进去还有害。

自动驾驶标注有标准答案，"行人还是车辆"边界清楚。

机器人数据复杂得多。同样是拧螺丝，力矩取决于型号和材质，没有通用答案。更麻烦的是坐标问题，同一台机器人的操作数据同时存在三套参考系（眼、末端和绝对位置），不对齐的话模型根本学不会。大家做法不统一，数据很难互通，这个问题目前还没有统一解法。

商业模式上也有风险：现阶段数采中心的收入高度依赖政府采购。补贴一旦收紧，没有技术壁垒的会最先出局。

五、国家开始建标准了

2026年5月，国家数据局把高质量具身数据集列为重要基础，工信部随后联合出台政策推动模型与数据协同。江苏率先落地省级方案，每年开放不低于100个真实应用场景，单项目最高支持100万元。国家统一数据集管理平台也已上线试运行。

从各地各自为政，到国家统一建标准，对有技术积累的头部公司是利好，对纯靠政策活着的是压力。

人形机器人"爆了"吗？

出货量数字是真实的。但如果大多数订单来自政府数采中心而非用户需求，距离真正的商业化还有距离。

自动驾驶也经历过这个阶段，特斯拉FSD跑了100亿英里才有今天。机器人走同一条路，只是更烧钱、周期更长。

数据公司是目前最确定的场景受益方。但门槛在快速抬高：从"能采数据"到"能采高质量数据"再到"跨场景标准化输出"，每升级一次都在淘汰一批人。

技术路线会变，补贴会退，大厂会入场。但数据的底层逻辑不会变。

我就是我，任尔东西南北风。

来源：天机辩 That SomeOne

2025年，人形机器人产业迎来爆发拐点。特斯拉Optimus量产在即，华为、宇树等企业加速技术突破，行业正从“实验室研发”向“规模化落地”跃迁为打通产业链上下游协作壁垒，艾邦机器人正式组建"人形机器人全产业链交流群"，覆盖金属材料、复合材料、传感器、电机、减速器等全硬件环节，助力企业精准对接资源、共享前沿技术！

扫码关注公众号，底部菜单申请进群

64个地方数采中心，人形机器人最大的买家

作者ab, 808

作者 ab, 808

相关文章

自变量发布跨模态具身动作分词器 X-Tokenizer，多模态对齐能力提升 13.5%，长程任务性能提升 8.25%

自变量连续完成四轮融资，自研端到端具身大模型获各领域头部资本持续加注

优艾智合具身智能系列新品全球首发：3年赋能10000个工业现场

You missed

自变量发布跨模态具身动作分词器 X-Tokenizer，多模态对齐能力提升 13.5%，长程任务性能提升 8.25%

自变量连续完成四轮融资，自研端到端具身大模型获各领域头部资本持续加注

优艾智合具身智能系列新品全球首发：3年赋能10000个工业现场

64个地方数采中心，人形机器人最大的买家