6月26日,记者从成都人形机器人创新中心获悉,日前,该中心发布了中国首个基于视觉扩散架构的人形机器人任务生成式模型R-DDPRM,这是人形机器人进化史上的重大核心技术突破。大家所熟知的文生视频模型OpenAISORA、SVD,文生图模型SD,OpenAIDall-E等业界知名模型就是基于扩散架构的垂直模型,他们无一例外都拥有强大的理解、推理和生成能力。
任务目标被随机改变后人形机器人的全局快速推理和执行能力
扩散架构应用于人形机器人核心技术研发是全球人工智能最新最尖端领域,将重构人形机器人底层架构,释放人形机器人的决策技能,使其在操纵和泛化方面达到前所未有的高度。目前全球范围内仅特斯拉、麻省理工+哥伦比亚大学联合团队等人形机器人国际顶尖团队发布相关阶段性成果。
特斯拉近期发布的擎天柱人形机器人在任务中断(电池被人为倾倒)时的任务断点快速全局推理与接续执行能力
目前业界的人形机器人任务生成式模型主要基于VAE、ACTransformer、LSTM等架构,这类架构下的人形机器人通常在规划动作时考虑单一约束类型,例如物体抓持稳定性或规避障碍物路径规划,这就需要针对每种细分情况都要对应开发和执行一系列单独的垂直模型(并联线性),遇到执行问题需要局部调整试错来缓慢推进任务进程,推理效率低、执行速度慢且大量消耗算力。而成都人形机器人创新中心首发的R-DDPRM模型能够让人形机器人跨越多个约束进行泛化(Fig1),创造了真正的人形机器人“大脑”——能够毫不犹豫“丝滑”的处理各种复杂任务。
成都人形机器人创新中心近期发布的任务中断时的任务断点快速全局推理与接续执行能力
该模型具有同时确定拿起物体的最佳抓持位姿、移动物体最佳路线、能耗最少最佳等多要素全局规划思维能力(Fig2)。而且能够在人为破坏任务进程时迅速进行决策修正和调整执行方式,接续完成任务(Fig3、Fig4)。该模型的泛化能力能让人形机器人自主流畅完成从整理房间到复杂外科手术等各种复杂任务。
R-DDPRM任务生成式模型具有更加稳定、任务执行成功率大幅提升、决策更敏捷、算力依赖度几何级降低(理论上中等消费级显卡在端上即可完成人形机器人绝大部分任务)、处理复杂场景任务的能力更强等绝对优势,将极大提升人形机器人的任务执行能力和效率,降低算力和能耗成本,实现人形机器人在任务生成上从并联线性推理到敏捷全局泛化推理的质的飞跃。这是人形机器人领域的突破性成果,将重新定义人形机器人推理和任务规划的底层逻辑。 |