小米MiMo要蹭着DeepSeek蹦上牌桌

565 0 0

文章摘要

小米近期宣布将MiMo-V2.5系列API进行永久降价，其定价策略直接对标DeepSeek，将大模型市场的价格竞争推向新阶段。此次降价并非单纯的常规促销，而是通过将token价格细分为缓存命中、缓存未命中和输出三种类型，反映了大模型厂商开始按照真实成本结构进行重新定价。在长上下文和重复输入场景增多的背景下，缓存命中成为降低成本的关键变量，使得价格降幅得以显著扩大。

降价的核心支撑并非依赖资金补贴，而是源于底层基础设施与推理优化能力的提升。小米团队基于SGLang HiCache完整支持SWA技术，大幅降低了KV Cache在GPU显存、CPU内存和SSD等多级存储之间的数据搬运量，并显著提升了可缓存token的数量。这种系统调度的优化有效控制了存储与搬运成本，使得低价策略建立在扎实的技术基础之上，从而具备长期可持续性。

在当前国产大模型市场中，DeepSeek已成为衡量模型定价的行业标尺，迫使其他厂商重新审视自身的性价比与核心优势。对于小米而言，MiMo作为后来者，面临的首要挑战是如何进入开发者的候选名单。通过像素级对标DeepSeek的价格，小米旨在降低开发者的试用门槛，获取在Agent、代码辅助和长对话等场景下的真实调用数据。这些真实数据对于模型能力的迭代至关重要，也是MiMo最终融入小米手机、汽车及智能硬件生态，成为AI基础能力的关键前提。

小米方面表示，在最新的降价策略下，其生产推理引擎在接近满负荷运转时仍能基本实现收支平衡。这表明通过模型架构创新和推理基础设施优化来压低API成本是可行的。如果这一模式能够得到验证，不仅有助于MiMo在激烈的市场竞争中占据一席之地，也有望在整个大模型行业内推动形成技术驱动成本下降的良性循环。