小米MiMo要蹭着DeepSeek蹦上牌桌

AI-Agent9分钟前发布 Si-Planet
39 0 0
小米MiMo要蹭着DeepSeek蹦上牌桌

 

文章摘要


【关 键 词】 小米降价价格战推理优化价格对标基础设施

小米近期宣布将MiMo-V2.5系列API进行永久降价,其定价策略直接对标DeepSeek,将大模型市场的价格竞争推向新阶段。此次降价并非单纯的常规促销,而是通过将token价格细分为缓存命中、缓存未命中和输出三种类型,反映了大模型厂商开始按照真实成本结构进行重新定价。在长上下文和重复输入场景增多的背景下,缓存命中成为降低成本的关键变量,使得价格降幅得以显著扩大。

降价的核心支撑并非依赖资金补贴,而是源于底层基础设施推理优化能力的提升。小米团队基于SGLang HiCache完整支持SWA技术,大幅降低了KV Cache在GPU显存、CPU内存和SSD等多级存储之间的数据搬运量,并显著提升了可缓存token的数量。这种系统调度的优化有效控制了存储与搬运成本,使得低价策略建立在扎实的技术基础之上,从而具备长期可持续性。

在当前国产大模型市场中,DeepSeek已成为衡量模型定价的行业标尺,迫使其他厂商重新审视自身的性价比与核心优势。对于小米而言,MiMo作为后来者,面临的首要挑战是如何进入开发者的候选名单。通过像素级对标DeepSeek的价格,小米旨在降低开发者的试用门槛,获取在Agent、代码辅助和长对话等场景下的真实调用数据。这些真实数据对于模型能力的迭代至关重要,也是MiMo最终融入小米手机、汽车及智能硬件生态,成为AI基础能力的关键前提。

小米方面表示,在最新的降价策略下,其生产推理引擎在接近满负荷运转时仍能基本实现收支平衡。这表明通过模型架构创新和推理基础设施优化来压低API成本是可行的。如果这一模式能够得到验证,不仅有助于MiMo在激烈的市场竞争中占据一席之地,也有望在整个大模型行业内推动形成技术驱动成本下降的良性循环。

原文和模型


【原文链接】 阅读原文 [ 2864字 | 12分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★

© 版权声明
xunfeiagent

相关文章

trae

暂无评论

暂无评论...