小米狂撒Token！最高降幅99%，全面对标DeepSeek

289 0 0

文章摘要

近期，国产大模型API市场掀起激烈的价格战，竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价，随后小米MiMo迅速跟进，最高降幅达99%，其Pro版核心价格与DeepSeek完全一致。这一系列降价动作标志着国产大模型API正从能力溢价阶段全面进入成本约束阶段。

DeepSeek的降价底气源于技术迭代与资本支持的双重驱动。其V4-Pro作为全球最大的开源混合专家模型，通过技术优化大幅降低了单次推理算力消耗与缓存显存占用。同时，公司推进的大额融资为其长期生态策略提供了资金保障，使得降价并非短期促销，而是着眼于通用人工智能目标的长期布局。

小米在跟进降价的同时，取消了上下文长度分档，直接降低了长上下文任务的使用门槛。小米通过后台工程优化，大幅降低了多级存储之间的数据搬运量，提升了可缓存数量与集群吞吐能力，证明了底层技术优化是厂商维持长期低价的核心支撑。这种极低的缓存命中价格，重新评估了代码助手、智能体工作流等复杂任务连续运行的成本，并在全球价格体系中展现出显著的数量级优势。

与此同时，大模型行业走势呈现出明显的分化态势。部分厂商开始推行订阅收费或上调API及算力产品价格，而DeepSeek与小米则选择持续压降服务成本。大模型API的竞争已不再局限于模型参数和榜单能力，而是深度延伸至推理框架、缓存系统和集群资源调度等基础设施能力的较量。能否在高并发、长上下文和多轮调用场景下持续压低单token服务成本，已成为衡量厂商综合实力的关键指标，后续压力将传导给更多模型厂商。