7月26日,智平方的通用智能机器人AlphaBot(爱宝)系列亮相2025世界人工智能大会(WAIC 2025)。
爱宝凭借一个硬件形态和一个基座大模型Alpha Brain,在现场真正上演了多场景、多任务的“技能秀”——打冰淇淋/咖啡/饮料、2X2码垛、打架子鼓。三场看似简单的演示,不仅将爱宝在生活、工业、娱乐三大场景背后的空间感知、长程柔性、全域全身、快速学习等技术底色展现得淋漓尽致,更是智平方对机器人通用性这一理念的践行。
打冰淇淋/咖啡/饮料
空间感知与长程柔性的实力秀
在生活服务体验区,智平方搭建了一个全场景软饮吧,直指特斯拉Optimus餐吧,让爱宝秒变“全能店员”。现场观众可以自由选择自己喜欢的口味和配料,无论是香醇的咖啡、清甜的冰淇淋,还是特调饮料,爱宝都能在软饮吧服务场景中无缝切换,精准制作。其中,一杯咖啡或冰淇淋的制作时间大约在1分半到2分钟,而饮料则更快,1分钟左右就能完成。
以打冰淇淋为例,当收到类似“爱宝,我想要一杯冰淇淋”的观众需求时,爱宝就会抬起左手手臂,拿起纸杯,放置到冰淇淋出口下方,右手精准地握住冰淇淋机的手柄,缓缓压下,冰淇淋开始顺滑地旋转落进杯子。等杯子装满后,爱宝立即松开手柄,将冰淇淋递给观众。整个过程动作行云流水、毫无顿挫。
爱宝依靠智平方自研的全域全身VLA(GOVLA)大模型,能够迅速完成复杂的空间感知与控制:杯子的位置、手柄的角度、冰淇淋旋转的高度都在它的掌控之中。而且,它不仅能操作眼前这一台冰淇淋机,它还能够基于同一款硬件和同一个预训练大模型,根据观众需求在冰淇淋机、咖啡机、饮料机之间自由切换,展现出极强的跨设备执行泛化能力。
2X2码垛
“全域全身”的工业硬实力
在工业方面,爱宝展示了其“全域全身”的码垛搬箱技能。只见爱宝来来回回,在展区里准确抓起箱子,将它们稳稳码放到托盘上。不到60秒,爱宝就能完成一次码垛,稳定性和效率让围观者连连称赞。
这背后更是智平方在GOVLA大模型上的突破。爱宝能够像人类一样在工厂环境中自由移动,而不是局限于固定工位,自主规划最优路径,灵活搬运不同种类、大小、角度、颜色的箱体。它通过多模态感知精准识别箱体状态,像熟练工人一样把垛码放得整整齐齐。当垛形不规范时,它会智能调整抓取策略;遇到突发状况也能自动纠错,确保作业流程持续运行。
相比传统的工业机器人只能在固定工位完成重复动作,爱宝的优势在于它的全域行动、全身协同的工作能力。爱宝全身拥有34+自由度,可连续工作6小时,单臂负载最高可达10公斤,作业高度最高可达2.4米。这种稳定性和高效性,使它成为制造业当下在“招工难、用工贵”困境下的理想补充。
打架子鼓
快速学习,实现速度与精准的默契配合
在娱乐方面,随着经典曲目《We Will Rock You》节奏的起伏,爱宝的手臂在鼓面上快速而准确地击打,每0.375秒就能完成一次敲击,鼓与鼓之间的切换仅需0.75秒,堪比一个经过专业训练的鼓手。
爱宝之所以能做到这样快而准,靠的是融入“异构输入+异步频率”创新架构设计的GOVLA大模型。模型架构借鉴了人类的“双系统”思维模式,且把“双系统”模块中的“快系统”嵌入“慢系统”:慢系统负责整体乐曲理解和节奏把控,而快系统则专注于快速、精准的动作执行。
此外,GOVLA大模型的高帧率控制能力(可达200-1000Hz)让整个演奏过程如丝般顺滑,没有延迟。对爱宝而言,乐谱只是一串数据,它可以通过搭载的大模型快速学习掌握新曲目,未来甚至能挑战120 BPM以上的快节奏演奏。据介绍,本次曲目的演示,爱宝只学习了大约24小时。
自研具身大模型发挥关键力量
三场演示的背后,智平方自主研发的端到端具身大模型Alpha Brain是关键。GOVLA作为Alpha Brain的核心技术,不同于传统机器人分模块控制的方式,它通过统一的模型架构,将多模态信息整合处理,实现了从感知到动作的“端到端闭环控制”。
GOVLA大模型让爱宝拥有全域行动和全身协同能力,突破了传统机器人“固定工位”的局限,以及从简单任务到长程复杂任务的推理能力,有效解决了复杂推理与快速行动难以兼得的难题,让爱宝机器人能够实现即想即动零延迟。


2025年,人形机器人产业迎来爆发拐点。特斯拉Optimus量产在即,华为、宇树等企业加速技术突破,行业正从“实验室研发”向“规模化落地”跃迁为打通产业链上下游协作壁垒,艾邦机器人正式组建"人形机器人全产业链交流群",覆盖金属材料、复合材料、传感器、电机、减速器等全硬件环节,助力企业精准对接资源、共享前沿技术!
扫码关注公众号,底部菜单申请进群
