300美元跑通世界模型！比老黄便宜10倍

53 0 0

文章摘要

X-Era Lab与星宸科技联合推出了首款端侧世界模型解决方案，成功将自研的世界动作模型部署于端侧芯片，实现了具身智能在感知、预测与控制上的全链路闭环。这一突破解决了传统具身智能高度依赖云端所带来的延迟、带宽瓶颈、高昂成本以及隐私泄露等问题，使世界模型真正走向端侧。

在技术路线上，当前的模型多停留在语言模态或二维像素空间，难以满足物理世界的高精度需求。该世界动作模型通过底层架构创新，将物理与动作向量放入同一节点内联合建模，结合时序维度构建四维数据表征，直接从预训练阶段灌入对物理世界的理解。这种原生设计使其绕过冗余的视觉细节，将算力集中于三维几何与时序运动，从而以更小的模型参数完成复杂任务，具备端侧部署的可行性。

在硬件适配与落地方面，模型的端侧运行离不开深度的软硬协同。研发团队与芯片方从底层工具链、算子实现到内存调度进行全栈联合优化，克服极端精度量化带来的挑战，使完整版世界模型能够在成本可控的端侧芯片上高效运行。芯片方不仅提供算力覆盖全面的处理器与推理框架，还布局三维感知硬件与统一软件底座，构建起从开发者赋能到产品落地的生态飞轮。

将世界模型部署于端侧，不仅打破了物理约束与商业约束，更为具身智能的商业化落地提供了确定的成本模型与隐私保障。这一技术演进推动机器人从依赖云端指令的设备，转变为具备自主决策能力的智能体。未来，具身智能将自然地融入真实物理场景，以极高的容错率和预判能力执行日常任务，实现技术从概念展示向寻常应用的实质性回归。