文章摘要
【关 键 词】 具身智能、世界模型、端侧部署、软硬协同、动作模型
X-Era Lab与星宸科技联合推出了首款端侧世界模型解决方案,成功将自研的世界动作模型部署于端侧芯片,实现了具身智能在感知、预测与控制上的全链路闭环。这一突破解决了传统具身智能高度依赖云端所带来的延迟、带宽瓶颈、高昂成本以及隐私泄露等问题,使世界模型真正走向端侧。
在技术路线上,当前的模型多停留在语言模态或二维像素空间,难以满足物理世界的高精度需求。该世界动作模型通过底层架构创新,将物理与动作向量放入同一节点内联合建模,结合时序维度构建四维数据表征,直接从预训练阶段灌入对物理世界的理解。这种原生设计使其绕过冗余的视觉细节,将算力集中于三维几何与时序运动,从而以更小的模型参数完成复杂任务,具备端侧部署的可行性。
在硬件适配与落地方面,模型的端侧运行离不开深度的软硬协同。研发团队与芯片方从底层工具链、算子实现到内存调度进行全栈联合优化,克服极端精度量化带来的挑战,使完整版世界模型能够在成本可控的端侧芯片上高效运行。芯片方不仅提供算力覆盖全面的处理器与推理框架,还布局三维感知硬件与统一软件底座,构建起从开发者赋能到产品落地的生态飞轮。
将世界模型部署于端侧,不仅打破了物理约束与商业约束,更为具身智能的商业化落地提供了确定的成本模型与隐私保障。这一技术演进推动机器人从依赖云端指令的设备,转变为具备自主决策能力的智能体。未来,具身智能将自然地融入真实物理场景,以极高的容错率和预判能力执行日常任务,实现技术从概念展示向寻常应用的实质性回归。
原文和模型
【原文链接】 阅读原文 [ 3902字 | 16分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



