DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了

AI-Agent52分钟前发布 Founder Park
45 0 0
DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了

 

文章摘要


【关 键 词】 AI模型技术更新推理能力工具调用开源模型

DeepSeek近日发布了V3.2正式版模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中,DeepSeek-V3.2在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro;而Speciale版本作为开源模型,在IMO 2025等主流推理基准上的表现与Gemini-3.0-Pro相当,并在多项顶级学术竞赛中达到金牌水平。

模型的技术创新主要体现在三个方面。首先,引入了DeepSeek Sparse Attention(DSA)技术,大幅提升了长文本处理效率。其次,实现了思考模式与非思考模式的工具调用统一,这是本次更新的核心突破。最后,通过大规模Agent训练数据合成方法,构建了大量”难解答,易验证”的任务,显著提升了模型泛化能力。在各类智能体工具调用评测中,DeepSeek-V3.2达到了开源模型的最高水平,且未针对测试集进行特殊训练,在真实场景中展现出强大泛化能力

从版本迭代来看,DeepSeek在2025年持续采用小版本更新策略,而非推出全新大版本。V3系列主要聚焦三个方面改进:MoE架构优化、Agent工具能力强化,以及思考/非思考模型的统一。这种迭代路径与Gemini、Claude和GPT-5等闭源模型的发展趋势一致。特别值得注意的是,基于V3.2-Exp-Base开发的DeepSeek-Math-V2数学模型已达到IMO金牌水平,显示出在专业领域的强大能力。

目前,DeepSeek-V3.2已在网页端、App和API上线,支持思考模式下的工具调用能力,而Speciale版本则以临时API形式开放供研究使用。尽管用户期待的大版本V4尚未发布,但V3系列的持续优化已展现出强大的技术积累,为未来的多模态、长上下文等重大升级奠定了坚实基础。

原文和模型


【原文链接】 阅读原文 [ 1578字 | 7分钟 ]
【原文作者】 Founder Park
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...