年中复盘,发现错过了不少机会。
最典型的是某灵巧手项目。All in具身的朋友应该很熟——估值从2亿人民币,到20亿,再到现在60亿美元,一年涨了将近二十倍。
更有意思的是它的收入结构:2025年营收不到3亿人民币。
客户都是谁啊?
很有意思, 不是本体厂,不是模型公司,是遍布全国的地方数据采集中心。
一、64个数采训练场,撑起了大半个具身产业
根据公开资料,截至2026年4月,全国运营或规划中的机器人数据采集中心已超过90个,约64个已正式投入使用,部分单点部署超过100台机器人。浙江、江苏、广东三省最集中,合计超30个。
运作逻辑是:国资/地方政府建中心、买本体/数采设备、招人采数据,再把数据卖给机器人厂商或数据服务商。
搞土地建工厂是国资最熟的事,拉就业搞产业落地是地方最愿意干的事,本体和模型公司负责出货和买数据。
看起来各取所需。但有个结构性问题值得注意:这个链条的增长,主要是由政策驱动,不是终端需求。
二、数据缺口到底有多大
大语言模型的训练数据量级是10的13次方;自动驾驶头部拥有百亿~千亿小时真人真车真路数据;而具身,我的朋友,训练数据是万小时级(有高有低)。机器人规则更加复杂,规模化落地,需要的比这些要多得多。行业公认的说法:所需与自动驾驶相差约100万倍左右。
现在,全行业目前的存量,估计只有几十万小时,和自动驾驶差的0我都数不过来了。
跟自动驾驶对比,就清楚有多难了。
特斯拉的数据是自己跑出来的,路上的tesla越多,数据越多,已有的100亿英里还在转数据飞轮。
机器人没这条件,工厂产线的数据用不到商超的,商超的用不到医院的,同一工厂不同工位可能都要重新采。
没有数据飞轮,只能靠人力逐个场景去堆。
采集效率也是硬伤。主流遥操作方案,一个人一小时大约最多产出一小时的有效数据,没有规模效应。其他数采方式,有效率仅仅50%。
所以才会遍地数采中心——数据不够,钱就得继续往里砸。
三、数据基建最先赚钱
数采中心大规模建设,直接带热了具身数据公司的融资。
2026年上半年,这个赛道的融资密度明显高于其他细分方向。
部分头部数据公司估值在几个月内翻倍,光轮近200亿;今年闻到味道刚创立的几个创业公司也已close融资,如千帧、intime等等。同时自动驾驶时代的老牌数据标注公司也在加速转型。
整条产业链里,数据是唯一确定会被持续消耗的东西。不管最后跑出来的是哪家机器人,训练数据都得买,数据公司稳赚。
四、坑也是有的
大规模建设的另一面,是数据质量问题开始暴露。
早期目标是"把量堆上去",但堆着堆着发现:低质量数据不只是没用,训练进去还有害。
自动驾驶标注有标准答案,"行人还是车辆"边界清楚。
机器人数据复杂得多。同样是拧螺丝,力矩取决于型号和材质,没有通用答案。更麻烦的是坐标问题,同一台机器人的操作数据同时存在三套参考系(眼、末端和绝对位置),不对齐的话模型根本学不会。大家做法不统一,数据很难互通,这个问题目前还没有统一解法。
商业模式上也有风险:现阶段数采中心的收入高度依赖政府采购。补贴一旦收紧,没有技术壁垒的会最先出局。
五、国家开始建标准了
2026年5月,国家数据局把高质量具身数据集列为重要基础,工信部随后联合出台政策推动模型与数据协同。江苏率先落地省级方案,每年开放不低于100个真实应用场景,单项目最高支持100万元。国家统一数据集管理平台也已上线试运行。
从各地各自为政,到国家统一建标准,对有技术积累的头部公司是利好,对纯靠政策活着的是压力。
人形机器人"爆了"吗?
出货量数字是真实的。但如果大多数订单来自政府数采中心而非用户需求,距离真正的商业化还有距离。
自动驾驶也经历过这个阶段,特斯拉FSD跑了100亿英里才有今天。机器人走同一条路,只是更烧钱、周期更长。
数据公司是目前最确定的场景受益方。但门槛在快速抬高:从"能采数据"到"能采高质量数据"再到"跨场景标准化输出",每升级一次都在淘汰一批人。
技术路线会变,补贴会退,大厂会入场。但数据的底层逻辑不会变。
我就是我,任尔东西南北风。
2025年,人形机器人产业迎来爆发拐点。特斯拉Optimus量产在即,华为、宇树等企业加速技术突破,行业正从“实验室研发”向“规模化落地”跃迁为打通产业链上下游协作壁垒,艾邦机器人正式组建"人形机器人全产业链交流群",覆盖金属材料、复合材料、传感器、电机、减速器等全硬件环节,助力企业精准对接资源、共享前沿技术!
扫码关注公众号,底部菜单申请进群

