文章摘要
【关 键 词】 Gemini模型、通用机器人、推理能力、跨平台迁移、数据训练
谷歌DeepMind发布新一代通用机器人基座模型Gemini Robotics 1.5系列,这是全球首个具备模拟推理能力的具身模型,是将通用AI推向现实世界的重要里程碑。
该系列由Gemini Robotics 1.5(GR 1.5)和Gemini Robotics – ER 1.5(GR – ER 1.5)两大模型组成。GR 1.5负责动作执行,GR – ER 1.5强化推理能力,提供规划与理解支持,两者结合能让机器人完成复杂多步任务,还能根据特定要求上网搜索以辅助完成任务,且具备零样本跨平台迁移能力。
GR 1.5系列展示了五大能力:一是能执行复杂长程任务,在执行过程中自我检测并修正;二是适配多种机器人硬件,一个通用模型可上手不同形态的硬件;三是实现跨机器人迁移,通过Motion Transfer技术形成跨平台的通用动作理解;四是作为推理型具身模型,行动前会生成内心独白,拆解任务步骤,提升可解释性;五是安全可解释,能自我修正操作,识别潜在风险,确保运行安全。
为实现“规划 + 执行”的完整闭环,GR 1.5系列有庞大而多样化的数据来源,包括真实机器人操作数据和互联网信息。研究团队还提出全新的Motion Transfer机制,将不同机器人平台的运动轨迹和操作经验映射到统一动作语义空间,增强任务泛化和跨机器人迁移能力。训练时约九成以上迭代在MuJoCo仿真环境中完成,提升了研发效率和现实执行的稳定性与安全性。
GR 1.5系列有三大核心创新:让机器人具备思考推理能力,增强可解释性和信任感;实现跨平台技能迁移,使机器人共享生态知识与经验;具身推理模型GR – ER 1.5提升“理解物理世界”的能力,在多项任务上超越GPT – 5和Gemini 2.5 Flash。评测显示,该系列在多项基准测试中表现出色,且未牺牲安全性。
回顾来看,谷歌此前已推出Gemini Robotics系列和Gemini Robotics On – Device。目前,开发者可通过Google AI Studio中的Gemini API使用GR – ER 1.5,而GR 1.5仅供少数谷歌DeepMind的合作伙伴使用。
原文和模型
【原文链接】 阅读原文 [ 2645字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★




