Anthropic新模型杀疯了！成本直降 2/3、性能直逼GPT-5，用户实测：比“吹”的还强，速度超 Sonnet 3.5 倍

645 0 0

文章摘要

Anthropic正式发布Claude Haiku 4.5模型，该版本作为其最小型模型的最新迭代，现已面向所有用户开放。官方宣称其性能接近Sonnet 4，但成本仅为后者的三分之一，速度提升超过两倍。该模型采用混合推理技术，能根据任务需求动态调整计算资源，默认模式下通过有限硬件资源生成响应，用户也可启用”扩展思考”模式获取更复杂但耗时的输出。其多模态处理能力支持20万token的输入和6.4万token的输出，适合处理大型商业文档等复杂任务。

基准测试数据显示，Haiku 4.5在SWE-bench代码生成测试中达到73%的准确率，与Sonnet 4及GPT-5表现相当；在Terminal-Bench命令行测试中获41%得分，OSWorld计算机操作模拟测试中以50.7%的成绩超越Sonnet 4的42.2%。数学任务中，借助Python工具支持时准确率高达96.3%，无工具状态下仍保持80.7%。安全评估显示，该模型未对齐行为发生率显著低于前代产品，成为Anthropic当前最安全的模型。

定价策略凸显其成本优势：输入token每百万1美元，输出每百万5美元，仅为Sonnet 4.5价格的三分之一。实际测试表明，其响应速度可达Sonnet的3.5倍，用户体验显著提升。企业用户可通过API构建多智能体系统，由Sonnet负责复杂规划，Haiku执行子任务，这种协作模式在金融监控、代码生成等领域展现出高效能。代码初创公司Augment报告称，该模型实现了Sonnet 4.5九成的性能，而演示软件公司Gamma则观察到其在幻灯片文本生成任务中65%的准确率，远超现有付费模型。

此次发布标志着AI经济逻辑的深刻转变——五个月内，同等性能的成本下降三分之二。Anthropic业务呈爆发式增长，月度年化收入逼近70亿美元，企业客户超30万家，其中代码生成工具Claude Code年收入已近10亿美元。分析师指出，行业竞争正推动技术快速迭代，未来竞争优势将取决于能否在智能、速度与成本间实现最优平衡。尽管头部厂商产品差异逐渐缩小，但Anthropic通过精准定位不同场景需求，构建起从轻量级Haiku到高性能Opus的完整产品矩阵，为AI技术的规模化应用提供了新的范式。