对话灵初智能王启斌:「操作才是皇冠上的明珠,移动只是入场券」

AIGC动态2小时前发布 aitechtalk
55 0 0
对话灵初智能王启斌:「操作才是皇冠上的明珠,移动只是入场券」

 

文章摘要


【关 键 词】 具身智能灵初智能灵巧操作轮式双臂小全栈

灵初智能具身智能赛道中坚持“轮式底盘加双臂”的技术路线,确立了灵巧操作的核心地位。公司创始人王启斌指出,操作才是皇冠上的明珠,移动只是入场券,任何移动机器人若不能闭环完成任务操作,就无法满足客户核心需求。在技术架构演进上,公司从VLA架构转向世界模型,发布了策略模型与动作条件型世界模型,通过在训练中引入失败样本,使模型能够理解失败机制并推演不同做法的结果。

在数据采集与处理方面,灵初智能洞察到纯视频数据在高频动态操作中精度不足的缺陷。公司自研多模态数据手套,采集包含视觉、触觉和关节角的亚毫米级高精度人类五指数据,不仅提升了模型在复杂物理交互中的涌现能力,还将综合采集成本降至真机遥操作方案的十分之一。这种对数据的深刻理解构成了公司的核心竞争壁垒,并计划未来采集百万小时级乃至亿小时级的人类数据以推动通用操作能力的涌现。

面对行业现状,灵初智能采取了“小全栈”的发展策略,聚焦整机设计与全栈软件自研,以跨越具身模型与物理硬件之间的动态鸿沟。由于具身模型需直接操控物理世界,软硬件深度耦合至关重要,纯算法授权模式在短期内难以跑通。公司预判,当前每家企业都必须做全栈的竞争状态将维持两年左右,随后行业生态位将重新分层,届时公司将专注于通用灵巧操作模型。在应用场景上,公司避开了泛化要求极高的家庭场景和节拍极快的工业流水线,选择切入物流、零售等泛化与节拍适中的中间态场景。

针对智驾背景企业跨界具身智能的趋势,王启斌提醒不要低估从移动智能到操作智能的巨大鸿沟,具身物理交互的复杂度远超自动驾驶。他建议跨界者把握较短的时间窗口,放弃打造通用平台的执念,优先从垂直窄切口深耕,将单一硬件形态与操作任务做闭环。未来,灵初智能计划发布基于更大规模数据的模型,实现通过自然语言指令控制机器人完成长程任务及未知场景下的技能组合涌现。

原文和模型


【原文链接】 阅读原文 [ 4190字 | 17分钟 ]
【原文作者】 AI科技评论
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★

© 版权声明
xunfeiagent

相关文章

trae

暂无评论

暂无评论...