文章摘要
【关 键 词】 具身智能、开源模型、真机测试、机器人、技术突破
自变量机器人开源端到端具身智能基础模型WALL-OSS在RoboChallenge真机基准测试中以54.69分位列总分榜单第二,超越国际知名模型pi0,并在叠洗碗巾、按按钮等具体任务中拿下多项单项第一。这一成绩标志着中国开源具身智能模型在真实物理环境中的稳定执行能力得到验证。参与评测的模型涵盖闭源与开源技术路线,而WALL-OSS与Physical Intelligence的pi0、Pi0.5共同占据前三,且均为开源模型。
评测任务设计聚焦机器人核心应用场景,如物体识别、状态判断和连续动作执行,通过朴素任务检验模型对物理世界的适应能力。WALL-OSS通过4.2B参数规模降低训练门槛,使其可在消费级显卡部署,显著提升落地可行性。RoboChallenge的评分依据并非文本生成,而是真实动作完成度,凸显模型在环境噪声、传感器误差等现实挑战中的泛化能力。开源模型的成绩因代码和权重公开而更具可信度,避免了闭源模型可能存在的定向优化问题。
WALL-OSS的技术路径创新体现在架构设计与训练范式上。通过“共享注意力+专家分流”架构解决多模态迁移中的灾难性遗忘问题,并采用分阶段训练融合思维链推理与动作生成能力。这种端到端设计使其成为少数实现感知—推理—执行闭环的开源统一模型,定位为行业基础设施。自变量机器人选择开源策略,旨在通过生态协作加速具身智能发展,而非依赖封闭迭代。
WALL-OSS的表现反映中国团队正以透明化方式参与全球具身智能竞争,推动行业从概念演示转向工程化阶段。随着真机评测标准化,提供稳定基础能力的开源模型可能成为未来创新的关键起点。这一案例也预示着中国开源力量在具身智能领域的崛起趋势。
原文和模型
【原文链接】 阅读原文 [ 1653字 | 7分钟 ]
【原文作者】 机器人前瞻
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆



