文章摘要
【关 键 词】 大模型、价格战、模型降价、推理成本、基础设施
近期,国产大模型API市场掀起激烈的价格战,竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价,随后小米MiMo迅速跟进,最高降幅达99%,其Pro版核心价格与DeepSeek完全一致。这一系列降价动作标志着国产大模型API正从能力溢价阶段全面进入成本约束阶段。
DeepSeek的降价底气源于技术迭代与资本支持的双重驱动。其V4-Pro作为全球最大的开源混合专家模型,通过技术优化大幅降低了单次推理算力消耗与缓存显存占用。同时,公司推进的大额融资为其长期生态策略提供了资金保障,使得降价并非短期促销,而是着眼于通用人工智能目标的长期布局。
小米在跟进降价的同时,取消了上下文长度分档,直接降低了长上下文任务的使用门槛。小米通过后台工程优化,大幅降低了多级存储之间的数据搬运量,提升了可缓存数量与集群吞吐能力,证明了底层技术优化是厂商维持长期低价的核心支撑。这种极低的缓存命中价格,重新评估了代码助手、智能体工作流等复杂任务连续运行的成本,并在全球价格体系中展现出显著的数量级优势。
与此同时,大模型行业走势呈现出明显的分化态势。部分厂商开始推行订阅收费或上调API及算力产品价格,而DeepSeek与小米则选择持续压降服务成本。大模型API的竞争已不再局限于模型参数和榜单能力,而是深度延伸至推理框架、缓存系统和集群资源调度等基础设施能力的较量。能否在高并发、长上下文和多轮调用场景下持续压低单token服务成本,已成为衡量厂商综合实力的关键指标,后续压力将传导给更多模型厂商。
原文和模型
【原文链接】 阅读原文 [ 1325字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★☆☆



