文章摘要
【关 键 词】 具身智能、行业峰会、技术架构、数据采集、硬件瓶颈
中国具身智能产业的核心议题与未来方向在智源具身2025 OpenDay活动中得到深入探讨。30余位行业领军人物围绕技术架构、数据获取路径、硬件瓶颈及商业化落地展开激烈辩论,揭示了当前发展阶段的关键矛盾与潜在突破点。
技术架构的革新需求成为首要焦点。与会专家普遍认为现有视觉-语言-动作(VLA)架构存在根本性缺陷,语言中心主义的设计逻辑与人类行为模式存在本质差异。招商局集团AI首席科学家张家兴提出的”动作优先”(Action First)理念获得广泛认同,清华大学赵行进一步提出构建”大动作模型”(Large Action Model)的设想,强调闭环反馈机制的重要性。但北京大学王鹤指出,当前真实场景数据量级不足可能延缓架构革新进程,智源研究院院长王仲远则预言,具身智能互联网的形成将是实现统一架构的前提条件,这需要千万级机器人终端的海量数据积累。
数据采集方法论的分歧同样显著。真实派与仿真派展现出鲜明对立,星海图赵行和智元机器人罗剑岚坚持真实场景数据的不可替代性,强调自主交互产生的数据才能形成有效飞轮。而加速进化程昊等则主张仿真数据的效率优势,特别是在基础运动能力训练方面。智源研究院提出的”第三条道路”颇具启发性:通过海量长视频构建世界模型基座,再结合真机数据进行微调,这种分层策略为数据饥渴问题提供了创新解决方案。
硬件发展面临的双重瓶颈引发深度讨论。智元机器人姚卯青区分了线性瓶颈(如关节发热、电池续航)和非线性瓶颈(软件泛化能力),指出硬件与人类灵巧度的差距仍是根本性制约。因时机器人蔡颖鹏强调物理极限的残酷性,而行业共识在于场景定义硬件:原力灵机唐文斌提出的”不要为了人形而人形”观点,揭示了商业化落地的本质逻辑——特定场景需求应驱动硬件形态创新。
商业化落地面临严峻考验。来自能源、通信等领域的甲方代表直指核心矛盾:客户只为解决问题而非技术先进性买单。优必选杨继峰揭示的”0或1″定制化困境,中国联通李凯提出的”三高”场景标准(高复杂度、高危险性、高成本),以及海信张名举强调的家电生态协同,共同勾勒出价值闭环的实现路径。软通天擎黄鹏的”场景再造”理念尤为关键,物理环境的结构化改造将成为模型落地的必要条件。
智源研究院的生态位战略展现出独特价值。通过开源RoboBrain、Emu3.5等基础设施,构建RoboCOIN数据集与评测标准,其”送水人”定位有效缓解了行业碎片化问题。这种公共产品供给不仅加速技术迭代,更通过建立共同语言降低了产业协作成本。当行业聚焦于2025年这个关键时点,基础设施完善度与场景深耕能力的结合,或将决定具身智能能否突破”Demo陷阱”实现规模落地。
原文和模型
【原文链接】 阅读原文 [ 2965字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★




