超越 SONIC !人形机器人通用小脑迎来 GPT 时刻
文章摘要
【关 键 词】 具身智能、运动控制、基座模型、零样本、动作语言
银河通用联合研究团队发布了全球首个人形通用小脑GPT基座大模型AstraBrain-WBC 0.5。该模型引入了20亿帧最大人类行为数据规模,拥有80.4M参数,实现了92.58%的零样本泛化成功率,在多项指标上显著优于现有最优方法。这一成果有效解决了人形机器人运动控制领域中敏捷、稳定和泛化难以兼顾的技术难题。
该模型的核心思想是将人体全身运动视为一种动作语言,采用处理自然语言的方式来理解和生成动作。其整体技术方案分为数据基建、架构改造和双阶段训练三个紧密衔接的阶段。在数据基建方面,通过整合多源动作数据并利用谐波运动嵌入技术进行聚类,构建了结构清晰的大规模数据集。在架构改造上,采用因果Transformer替代传统的浅层多层感知机,以捕捉更长的时间上下文。双阶段训练则先为不同运动簇训练专门的运动专家,随后通过数据集聚合算法将专家经验蒸馏至单一模型中,从而兼顾高性能与通用性。
实验结果验证了缩放定律在人形运动控制领域的真实存在,证明Transformer架构不仅具备更高的容量天花板,还能通过工程优化将端到端推理延迟控制在1.5毫秒以下。在真机实测中,模型无需预先编程或任务微调,即可零样本完成武术、舞蹈及高动态动作,并展现出极强的抗干扰鲁棒性,实现了从单一行走控制到复杂全身运动跟踪的跨越。
在产业应用层面,AstraBrain-WBC 0.5作为预训练的运控基座,大幅降低了二次开发的研究门槛,可广泛应用于娱乐表演、应急救援等复杂场景。作为银河星脑系统的小脑模块,该模型不仅补齐了全身运动控制的关键拼图,还通过通用化底座显著降低了场景定制开发成本,正在重构人形机器人的商业落地模型。
原文和模型
【原文链接】 阅读原文 [ 4627字 | 19分钟 ]
【原文作者】 AI科技评论
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★



