王兴兴GTC最新演讲：迈过具身智能临界点，还有三道坎

58 0 0

文章摘要

宇树科技创始人王兴兴在GTC2026上系统阐述了具身智能当前的发展阶段、核心瓶颈与未来路径。他指出，尽管具身智能已成为全球关注焦点，但行业尚未跨越“ChatGPT时刻”，关键在于缺乏能在陌生场景中稳定执行任务的强泛化模型。若机器人能在80%的陌生场景中，仅凭语言或文字指令完成80%的任务，才标志这一临界点真正到来。该目标要求模型具备高度任务理解与动作生成能力，且无需重新训练或部署即可适应全新环境。

在技术层面，王兴兴强调运动能力是干活能力的前提，必须同步推进二者发展。没有足够丰富的动作表达与高稳定性，机器人难以进入工厂、家庭等真实场景。其团队已实现人形机器人H1长跑1500米约6分钟、摔倒自主起身、任意动作下抗冲击等能力，并通过预训练全身强化学习（RL）模型支持复杂动作组合与即时切换——这是春晚节目中机器人完成醉拳、空翻、舞棍等高难度动作的技术基础。节目背后依赖的是整套系统能力，包括全身状态感知模型、集群控制系统及128线激光雷达改装以提升多机环境下的感知可靠性。

针对行业共性瓶颈，王兴兴提出三大待解问题：一是提升模型对任务与动作的表达能力，突破泛化限制；二是提高视频、仿真与真机数据的利用效率，减少对大规模真机采集的依赖，尤其应充分利用互联网海量视频与文本数据；三是使强化学习形成可复用、可积累的规模效应，避免每次新动作都需从头训练。他认为，当前VLA模型虽有价值，但天花板较低；而世界模型或视频生成模型更具潜力，因其能整合互联网多模态数据，理论上可大幅提升训练基础。宇树已开源相关视频生成世界模型，但面临视频模态与真机模态难以精确对齐的挑战，需结合强化学习进行误差校正。

产品布局方面，宇树持续推出差异化机型：小巧高性价比的G1人形机器人、工业级中型机器狗、1.8米高H1人形机器人及负载强、续航长的小型机器狗As2，覆盖教育、巡检、物流、家庭协助等场景。小尺寸机器人受限于负载与力量，大尺寸机型虽能力更强，却带来更高安全风险，需保持2–3米安全距离。在实际作业中，简单抓取任务成功率接近100%，但多工序、小零件装配等长任务链仍具挑战。全身遥操作作为高效数据采集手段已取得进展，但动作流畅性与抖动问题尚待优化。王兴兴最后呼吁全球协作推动行业发展，认为“大家好，才是真的好”。