DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半

DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半

 

文章摘要


【关 键 词】 AI模型技术革新API降价长文本处理开源社区

DeepSeek正式推出实验性模型DeepSeek-V3.2-Exp,该版本在V3.1-Terminus基础上引入革命性的DeepSeek稀疏注意力(DSA)技术。DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型性能的前提下,显著提升长文本训练和推理效率。官方通过严格对齐V3.1-Terminus的训练设置进行评测,结果显示新模型在各领域公开评测集上表现与旧版基本持平。

模型效率提升带来直接的成本优势。API调用价格整体降幅超过50%,大幅降低开发者使用门槛。所有官方平台(App、网页端、小程序)和标准API接口均已默认升级至V3.2-Exp版本。为方便用户对比测试,官方限时保留V3.1-Terminus的API访问通道至2025年10月15日,且调用价格与新版本保持一致。

技术实现方面,新模型采用TileLang语言进行快速原型开发,最终开源版本包含TileLang与CUDA两种算子实现。研究团队建议社区在研究性实验中优先使用基于TileLang的版本以便调试迭代。模型已在HuggingFace和ModelScope平台开源,相关论文也同步公开发布。

官方特别强调该版本仍处于实验阶段,邀请用户通过专门反馈渠道提交真实场景测试结果。除核心模型更新外,公告还附带了AI产品市集社群的推广信息,该社群提供最新AI产品资讯、邀请码福利及精准曝光渠道。文末推荐了多篇AI领域相关文章,涵盖产品市场契合度探讨、图像生成技术演进等前沿话题。

原文和模型


【原文链接】 阅读原文 [ 1077字 | 5分钟 ]
【原文作者】 Founder Park
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...