加量不加价，一篇说明白 Claude Sonnet 4.5 强在哪

771 0 0

文章摘要

Anthropic发布了其最新AI模型Claude Sonnet 4.5，宣称这是目前世界上最好的编码模型。该模型在专注度方面表现突出，能够持续处理复杂任务超过30小时，远超竞争对手GPT-5 Codex的7小时。定价策略保持与上一代相同，同时通过提示缓存和批量处理可显著降低成本。

在核心功能升级方面，Claude Code新增了检查点功能，允许保存进度并回滚到之前状态，同时更新了终端界面并发布了原生VS Code扩展。API方面增加了上下文编辑和记忆工具，使智能体能够处理更复杂的任务。应用层面则直接集成了代码执行和文件创建功能。

性能评测显示，Claude Sonnet 4.5在SWE-bench Verified评测中达到业界领先水平，在OSWorld基准测试中以61.4%的得分领先。模型在推理、数学及专业领域（金融、法律、医学和STEM）的表现均有显著提升。

安全性方面，该模型被描述为Anthropic对齐性最好的前沿模型，减少了谄媚、欺骗等不良行为。在防御提示注入攻击方面取得重大进展，并采用AI安全级别3（ASL-3）保护机制，配备检测危险内容的分类器。

Anthropic同时发布了Claude Agent SDK，提供构建AI智能体所需的基础设施，以及实验性功能”Imagine with Claude”，展示模型实时生成软件的能力。这些更新对所有开发者开放，建议所有用户升级至新版本以获得性能提升。