DeepSeek V3.2 发布：长文本能力新突破，API 价格砍半

115 0 0

文章摘要

DeepSeek正式推出实验性模型DeepSeek-V3.2-Exp，该版本在V3.1-Terminus基础上引入革命性的DeepSeek稀疏注意力（DSA）技术。DSA首次实现细粒度稀疏注意力机制，在几乎不影响模型性能的前提下，显著提升长文本训练和推理效率。官方通过严格对齐V3.1-Terminus的训练设置进行评测，结果显示新模型在各领域公开评测集上表现与旧版基本持平。

模型效率提升带来直接的成本优势。API调用价格整体降幅超过50%，大幅降低开发者使用门槛。所有官方平台（App、网页端、小程序）和标准API接口均已默认升级至V3.2-Exp版本。为方便用户对比测试，官方限时保留V3.1-Terminus的API访问通道至2025年10月15日，且调用价格与新版本保持一致。

技术实现方面，新模型采用TileLang语言进行快速原型开发，最终开源版本包含TileLang与CUDA两种算子实现。研究团队建议社区在研究性实验中优先使用基于TileLang的版本以便调试迭代。模型已在HuggingFace和ModelScope平台开源，相关论文也同步公开发布。

官方特别强调该版本仍处于实验阶段，邀请用户通过专门反馈渠道提交真实场景测试结果。除核心模型更新外，公告还附带了AI产品市集社群的推广信息，该社群提供最新AI产品资讯、邀请码福利及精准曝光渠道。文末推荐了多篇AI领域相关文章，涵盖产品市场契合度探讨、图像生成技术演进等前沿话题。