DeepSeek V3.2 正式版发布，V4 还没来，但已经是开源模型里 Agent 能力最强了

501 0 0

文章摘要

DeepSeek近日发布了V3.2正式版模型，包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中，DeepSeek-V3.2在公开推理基准测试中达到GPT-5水平，略低于Gemini-3.0-Pro；而Speciale版本作为开源模型，在IMO 2025等主流推理基准上的表现与Gemini-3.0-Pro相当，并在多项顶级学术竞赛中达到金牌水平。

模型的技术创新主要体现在三个方面。首先，引入了DeepSeek Sparse Attention（DSA）技术，大幅提升了长文本处理效率。其次，实现了思考模式与非思考模式的工具调用统一，这是本次更新的核心突破。最后，通过大规模Agent训练数据合成方法，构建了大量”难解答，易验证”的任务，显著提升了模型泛化能力。在各类智能体工具调用评测中，DeepSeek-V3.2达到了开源模型的最高水平，且未针对测试集进行特殊训练，在真实场景中展现出强大泛化能力。

从版本迭代来看，DeepSeek在2025年持续采用小版本更新策略，而非推出全新大版本。V3系列主要聚焦三个方面改进：MoE架构优化、Agent工具能力强化，以及思考/非思考模型的统一。这种迭代路径与Gemini、Claude和GPT-5等闭源模型的发展趋势一致。特别值得注意的是，基于V3.2-Exp-Base开发的DeepSeek-Math-V2数学模型已达到IMO金牌水平，显示出在专业领域的强大能力。

目前，DeepSeek-V3.2已在网页端、App和API上线，支持思考模式下的工具调用能力，而Speciale版本则以临时API形式开放供研究使用。尽管用户期待的大版本V4尚未发布，但V3系列的持续优化已展现出强大的技术积累，为未来的多模态、长上下文等重大升级奠定了坚实基础。