加量不加价,一篇说明白 Claude Sonnet 4.5 强在哪

文章摘要
【关 键 词】 AI模型、编码能力、性能评测、开发者工具、安全对齐
Anthropic发布了其最新AI模型Claude Sonnet 4.5,宣称这是目前世界上最好的编码模型。该模型在专注度方面表现突出,能够持续处理复杂任务超过30小时,远超竞争对手GPT-5 Codex的7小时。定价策略保持与上一代相同,同时通过提示缓存和批量处理可显著降低成本。
在核心功能升级方面,Claude Code新增了检查点功能,允许保存进度并回滚到之前状态,同时更新了终端界面并发布了原生VS Code扩展。API方面增加了上下文编辑和记忆工具,使智能体能够处理更复杂的任务。应用层面则直接集成了代码执行和文件创建功能。
性能评测显示,Claude Sonnet 4.5在SWE-bench Verified评测中达到业界领先水平,在OSWorld基准测试中以61.4%的得分领先。模型在推理、数学及专业领域(金融、法律、医学和STEM)的表现均有显著提升。
安全性方面,该模型被描述为Anthropic对齐性最好的前沿模型,减少了谄媚、欺骗等不良行为。在防御提示注入攻击方面取得重大进展,并采用AI安全级别3(ASL-3)保护机制,配备检测危险内容的分类器。
Anthropic同时发布了Claude Agent SDK,提供构建AI智能体所需的基础设施,以及实验性功能”Imagine with Claude”,展示模型实时生成软件的能力。这些更新对所有开发者开放,建议所有用户升级至新版本以获得性能提升。
原文和模型
【原文链接】 阅读原文 [ 1760字 | 8分钟 ]
【原文作者】 Founder Park
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...