辉羲智能发布自研RhinoVLA技术报告,展示了一套面向机器人端侧实时控制的全国产模型-芯片-机器人VLA系统:辉羲自研VLA、辉羲自研R1芯片,机器人本体来自辉羲的合作企业智元、银河通用机器人。



在性能上,RhinoVLA在辉羲R1芯片上实现了11.69Hz端到端推理频率,跨过了机器人实时闭环控制常用的10Hz门槛。同时,在保持模型参数量相近前提下,RhinoVLA在跨本体下游任务中的成功率与领域代表VLA模型π0.5接近。在技术报告中,团队就VLA端侧实时部署跨本体适配两大困难分别给出了答案。

论文链接:https://arxiv.org/pdf/2606.07383

开源链接:https://github.com/HuixiAI/RhinoVLA

端侧实时部署

VLA应用想要真正落地,就必须满足推理的实时性要求,这是因为机器人在执行任务过程中需要边感知边行动,较高的VLA推理延迟会直接导致动作滞后,降低任务成功率,并引发安全风险。然而,VLA模型参数多、输入模态多,导致计算和访存开销高,而端侧硬件往往受功耗和散热限制,实现低延迟部署并不容易。针对这一困难,RhinoVLA方案从算法-系统联合优化的角度给出方案。


算法减负:RhinoVLA采用了VLM、Action Expert两段式结构,这两个模块分别负责视觉语言理解和机器人动作生成。其中,VLM需要同时处理头部相机、腕部相机、用户指令等多模态输入,往往面临计算量大的问题。为了降低端侧硬件的计算压力,团队选择Qwen3-VL作为VLM主干网络,在保持输入分辨率一致的前提下,该模型相比于π0.5使用的PaliGemma主干网络,视觉token计算负担降低约4倍,从源头减轻端侧计算压力。


系统提速:团队采用辉羲自研R1芯片,其算力可达500TOPS,是NVIDIA Orin X的2倍,更符合VLA部署的算力需求。此外,团队还针对R1芯片的硬件特性,设计了算子-计算图-运行时三个层级的联合优化方案,最终实现RhinoVLA 11.69Hz端到端推理频率,达到了机器人实时闭环控制的基本门槛。


跨本体适配

为了让端侧算力优势真正适配不同机器人平台,团队设计了一套统一适配方案,以解决跨本体遇到的三类关键差异:视觉观测接口不一致状态-动作接口不一致,以及机器人本体实例差异



A. 视觉观测接口不一致 (Camera-view heterogeneity)针对不同机器人视觉传感器的种类和传感器不同,团队提出了视角注册(View Registry),给不同来源的图像显式标注视角和模态,例如head、depth等,使得模型不再依赖“第几个图像就是哪个视角”的隐式假设。


B. 状态-动作接口不一致 (Action-schema heterogeneity)不同机器人的关节数、关节角度范围各异,RhinoVLA 使用统一的72维物理状态-动作向量,向量中的每个维度都有固定物理语义,比如机械臂关节、夹爪闭合度等,不同机器人本体只填写自己关节相关的向量维度,就能让模型训练中理解区分。


C. 机器人本体实例差异 (Robot-instance variation)不同机器人身高、四肢拓扑均有区别,针对这一问题,RhinoVLA为每个机器人本体在基模型之外添加可训练的LoRA模块。在此方案下,不同机器人本体既可以共享基模型学到的通用动作生成能力,又可以学到本体差异带来的动作区别。


RhinoVLA跨本体真机部署视频如下:

视频1 RhinoVLA运行在银河G1(辉羲R1芯片):三次指令,演示模型的指令跟随能力


视频2 RhinoVLA运行在智元G2(辉羲R1芯片):一次长指令,展示模型的长程任务能力


视频3 RhinoVLA运行在智元G1(辉羲R1芯片):叠毛巾,展示模型的双臂柔性任务能力


RhinoVLA是辉羲在VLA领域算法-系统联合设计的一次重要尝试。辉羲工程师与研究员们通过AI agent辅助,已经实现了机器人在R1系统上完成真机数据采集、模型训练和端侧实时推理的流程。通过这条路径,辉羲致力于进一步打通国产模型、国产芯片和国产机器人的协同链路,推动VLA从单次部署走向端侧闭环迭代。



关于辉羲智能

辉羲智能由清华背景的顶尖专家团队创立,创始团队具备多次原创AI计算平台大规模量产落地经验。公司成立四年,已实现行业领先的具身智能算力系统芯片光至R1的规模化量产交付,率先在具身智能领域走通“芯片-平台-产品”的全栈自主国产化路径。辉羲智能致力于成为全球领先的具身智能AI计算平台供应商,以卓越算力促进人工智能发展。

2025年,人形机器人产业迎来爆发拐点。特斯拉Optimus量产在即,华为、宇树等企业加速技术突破,行业正从“实验室研发”向“规模化落地”跃迁为打通产业链上下游协作壁垒,艾邦机器人正式组建"人形机器人全产业链交流群",覆盖金属材料、复合材料、传感器、电机、减速器等全硬件环节,助力企业精准对接资源、共享前沿技术!

扫码关注公众号,底部菜单申请进群

作者 ab, 808