年中复盘,发现错过了不少机会。

最典型的是某灵巧手项目。All in具身的朋友应该很熟——估值从2亿人民币,到20亿,再到现在60亿美元,一年涨了将近二十倍。

更有意思的是它的收入结构:2025年营收不到3亿人民币。

客户都是谁啊?

很有意思, 不是本体厂,不是模型公司,是遍布全国的地方数据采集中心。

一、64个数采训练场,撑起了大半个具身产业

根据公开资料,截至20264月,全国运营或规划中的机器人数据采集中心已超过90个,约64个已正式投入使用,部分单点部署超过100台机器人。浙江、江苏、广东三省最集中,合计超30个。

运作逻辑是:国资/地方政府建中心、买本体/数采设备、招人采数据,再把数据卖给机器人厂商或数据服务商。

搞土地建工厂是国资最熟的事,拉就业搞产业落地是地方最愿意干的事,本体和模型公司负责出货和买数据。

看起来各取所需。但有个结构性问题值得注意:这个链条的增长,主要是由政策驱动,不是终端需求。

二、数据缺口到底有多大

大语言模型的训练数据量级是1013次方;自动驾驶头部拥有百亿~千亿小时真人真车真路数据;而具身,我的朋友,训练数据是万小时级(有高有低)。机器人规则更加复杂,规模化落地,需要的比这些要多得多。行业公认的说法:所需与自动驾驶相差约100万倍左右。

现在,全行业目前的存量,估计只有几十万小时,和自动驾驶差的0我都数不过来了。

跟自动驾驶对比,就清楚有多难了。

特斯拉的数据是自己跑出来的,路上的tesla越多,数据越多,已有的100亿英里还在转数据飞轮。

机器人没这条件,工厂产线的数据用不到商超的,商超的用不到医院的,同一工厂不同工位可能都要重新采。

没有数据飞轮,只能靠人力逐个场景去堆。

采集效率也是硬伤。主流遥操作方案,一个人一小时大约最多产出一小时的有效数据,没有规模效应。其他数采方式,有效率仅仅50%

所以才会遍地数采中心——数据不够,钱就得继续往里砸。

三、数据基建最先赚钱

数采中心大规模建设,直接带热了具身数据公司的融资。

2026年上半年,这个赛道的融资密度明显高于其他细分方向。

部分头部数据公司估值在几个月内翻倍,光轮近200亿;今年闻到味道刚创立的几个创业公司也已close融资,如千帧、intime等等。同时自动驾驶时代的老牌数据标注公司也在加速转型。

整条产业链里,数据是唯一确定会被持续消耗的东西。不管最后跑出来的是哪家机器人,训练数据都得买,数据公司稳赚。

四、坑也是有的

大规模建设的另一面,是数据质量问题开始暴露。

早期目标是"把量堆上去",但堆着堆着发现:低质量数据不只是没用,训练进去还有害。

自动驾驶标注有标准答案,"行人还是车辆"边界清楚。

机器人数据复杂得多。同样是拧螺丝,力矩取决于型号和材质,没有通用答案。更麻烦的是坐标问题,同一台机器人的操作数据同时存在三套参考系(眼、末端和绝对位置),不对齐的话模型根本学不会。大家做法不统一,数据很难互通,这个问题目前还没有统一解法。

商业模式上也有风险:现阶段数采中心的收入高度依赖政府采购。补贴一旦收紧,没有技术壁垒的会最先出局。

五、国家开始建标准了

20265月,国家数据局把高质量具身数据集列为重要基础,工信部随后联合出台政策推动模型与数据协同。江苏率先落地省级方案,每年开放不低于100个真实应用场景,单项目最高支持100万元。国家统一数据集管理平台也已上线试运行。

从各地各自为政,到国家统一建标准,对有技术积累的头部公司是利好,对纯靠政策活着的是压力。

人形机器人"爆了"吗?

出货量数字是真实的。但如果大多数订单来自政府数采中心而非用户需求,距离真正的商业化还有距离。

自动驾驶也经历过这个阶段,特斯拉FSD跑了100亿英里才有今天。机器人走同一条路,只是更烧钱、周期更长。

数据公司是目前最确定的场景受益方。但门槛在快速抬高:从"能采数据""能采高质量数据"再到"跨场景标准化输出",每升级一次都在淘汰一批人。

技术路线会变,补贴会退,大厂会入场。但数据的底层逻辑不会变。

我就是我,任尔东西南北风。

来源:天机辩 That SomeOne

2025年,人形机器人产业迎来爆发拐点。特斯拉Optimus量产在即,华为、宇树等企业加速技术突破,行业正从“实验室研发”向“规模化落地”跃迁为打通产业链上下游协作壁垒,艾邦机器人正式组建"人形机器人全产业链交流群",覆盖金属材料、复合材料、传感器、电机、减速器等全硬件环节,助力企业精准对接资源、共享前沿技术!

扫码关注公众号,底部菜单申请进群

作者 ab, 808