
文章摘要
【关 键 词】 AI模型、编程能力、推理任务、自动化、写作助手
Anthropic最新发布的大模型Claude Opus 4和Claude Sonnet 4在多个领域展现了显著的进步,尤其是在推理、编程和复杂任务解决能力方面。这两款模型在复杂推理和工具使用上已经超越了GPT-4.1、o3和Gemini 2.5 Pro。Opus 4是Anthropic目前最强的AI模型,能够连续工作数小时,大幅提升了AI自动化的可能性。在编程方面,Opus 4被称为“全球最强编程模型”,在写代码和使用各种工具(如联网搜索)方面表现优异。相比之下,Sonnet 4则以高性价比和高效率为特点,更适合日常使用,替代了今年2月上线的3.7 Sonnet。
两款新模型在任务执行中的出错概率比上代模型降低了65%,并且在长时间、分阶段任务中的记忆力也有所提升。Anthropic从去年开始,将模型的方向聚焦于提升执行复杂任务的能力,如研究和编程,甚至能编写完整代码库。首席科学官Jared Kaplan表示,公司正专注于解决模型在复杂任务中“跑偏”的问题,使用户能够一次性委托大量工作给模型。
目前,Opus 4和Sonnet 4已经在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上线,并包含在Claude的付费套餐中,支持扩展思考模式。免费用户目前只能试用Sonnet 4。除了编程,新模型在写作方面也表现出色。首席产品官Mike Krieger表示,Opus 4已经能够完成大部分写作任务,几乎无法与他的写作风格区分。知名内容社区Every的CEO也提到了Claude 4在写作方面的优异表现。
Anthropic未来将在编程和Agent行为以及模型如何学习并成为真正有用的写作伙伴两个方向上进行重点探索。这印证了OpenAI研究院姚顺雨对大模型下半场的论断,即从构建更聪明的模型转向定义问题并根据场景和评估手段进行特性调整。
对于程序员来说,AI写代码的能力突飞猛进,不仅能够补全代码,还能编写完整模块甚至独立开发小工具。未来,AI可能会成为程序员24小时不下班的“搭档”,推动程序员从“写代码的人”向“定义问题的人”转变。这一变革浪潮已经不可逆转,程序员需要思考真正要解决的需求,以及AI生成的代码是否贴合场景,最终实现业务逻辑和产品体验。
原文和模型
【原文链接】 阅读原文 [ 1159字 | 5分钟 ]
【原文作者】 AI产品阿颖
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆