文章摘要
【关 键 词】 具身智能、任务泛化、数据效率、强化学习、世界模型
宇树科技创始人王兴兴在GTC2026上系统阐述了具身智能当前的发展阶段、核心瓶颈与未来路径。他指出,尽管具身智能已成为全球关注焦点,但行业尚未跨越“ChatGPT时刻”,关键在于缺乏能在陌生场景中稳定执行任务的强泛化模型。若机器人能在80%的陌生场景中,仅凭语言或文字指令完成80%的任务,才标志这一临界点真正到来。该目标要求模型具备高度任务理解与动作生成能力,且无需重新训练或部署即可适应全新环境。
在技术层面,王兴兴强调运动能力是干活能力的前提,必须同步推进二者发展。没有足够丰富的动作表达与高稳定性,机器人难以进入工厂、家庭等真实场景。其团队已实现人形机器人H1长跑1500米约6分钟、摔倒自主起身、任意动作下抗冲击等能力,并通过预训练全身强化学习(RL)模型支持复杂动作组合与即时切换——这是春晚节目中机器人完成醉拳、空翻、舞棍等高难度动作的技术基础。节目背后依赖的是整套系统能力,包括全身状态感知模型、集群控制系统及128线激光雷达改装以提升多机环境下的感知可靠性。
针对行业共性瓶颈,王兴兴提出三大待解问题:一是提升模型对任务与动作的表达能力,突破泛化限制;二是提高视频、仿真与真机数据的利用效率,减少对大规模真机采集的依赖,尤其应充分利用互联网海量视频与文本数据;三是使强化学习形成可复用、可积累的规模效应,避免每次新动作都需从头训练。他认为,当前VLA模型虽有价值,但天花板较低;而世界模型或视频生成模型更具潜力,因其能整合互联网多模态数据,理论上可大幅提升训练基础。宇树已开源相关视频生成世界模型,但面临视频模态与真机模态难以精确对齐的挑战,需结合强化学习进行误差校正。
产品布局方面,宇树持续推出差异化机型:小巧高性价比的G1人形机器人、工业级中型机器狗、1.8米高H1人形机器人及负载强、续航长的小型机器狗As2,覆盖教育、巡检、物流、家庭协助等场景。小尺寸机器人受限于负载与力量,大尺寸机型虽能力更强,却带来更高安全风险,需保持2–3米安全距离。在实际作业中,简单抓取任务成功率接近100%,但多工序、小零件装配等长任务链仍具挑战。全身遥操作作为高效数据采集手段已取得进展,但动作流畅性与抖动问题尚待优化。王兴兴最后呼吁全球协作推动行业发展,认为“大家好,才是真的好”。
原文和模型
【原文链接】 阅读原文 [ 4679字 | 19分钟 ]
【原文作者】 机器人前瞻
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★★★★☆



