文章摘要
【关 键 词】 具身智能、世界模型、通用大脑、动作预测、长程任务
生数科技发布的世界行动模型MotuBrain在WorldArena与RoboTwin2.0两项国际权威评测中同步位列第一,成功打通环境感知与物理执行的底层数据链路。该架构彻底突破了视觉语言方案与独立世界模型长期割裂的技术瓶颈,系统通过自研统一框架将视频生成、环境推演与运动控制融合于单一训练流程。此种一体化设计使得智能体无需依赖外部上层规划器,即可自主解析动态场景偏差并独立执行跨阶段复杂操作。
在核心算法层面,方案引入潜动作变分自编码器与混合专家网络,实现了对海量多源无标签视频数据的运动先验提取。显著的规模增长效应表明,随着跨领域任务维度的持续扩充,模型在陌生物理环境中的迁移效率呈现确定性上升,有力印证其掌握通用因果规律而非记忆特定轨迹。同时,标准化的动作抽象层有效消解了异构硬件带来的适配壁垒,统一参数网络已具备向多形态机器人平台无缝切换的工业化部署条件。
实际交互验证进一步证实了其长程闭环控制与物理预见性能。系统依托多模态协同与自回归推理机制,完整打通了包含十余个基础操作单元的连续任务链条,从根本上规避了传统快慢系统拼接导致的执行断档风险。世界状态预测与底层实时驱动的深度融合,标志着具身智能正式跨越算法验证期,迈入多本体协同与真实场景高可靠落地的新阶段。
原文和模型
【原文链接】 阅读原文 [ 4771字 | 20分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3.6-plus-2026-04-02
【摘要评分】 ★★☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



