GPT-5.4深夜发布,最适合OpenClaw的天选模型登场了。

AI-Agent2小时前发布 admin
43 0 0
GPT-5.4深夜发布,最适合OpenClaw的天选模型登场了。

 

文章摘要


【关 键 词】 GPT-5.4OpenClaw基座模型代码能力价格优势

开发OpenClaw工具的团队长期在Agent基座模型选择上陷入困境,原有的Claude Opus 4.6综合能力达标,可满足Agent开发的需求,但API价格高昂,且无法使用订阅额度,此前可用的反代调用途径也因平台封号政策无法继续使用;此前OpenAI推出的GPT-5.3-Codex代码能力出众,但属于编程特化模型,世界知识储备不足,输出晦涩难懂,无法作为默认模型使用,GPT-5.2又存在代码能力不足的短板,因此一直期待能补足短板的新OpenAI模型。

一款合格的顶级Agent基座模型,需要同时具备出色的代码能力、充足的世界知识、优秀的多模态理解,同时价格亲民,支持第三方工具调用。此次发布的GPT-5.4各项核心跑分表现优异,完全符合需求:在衡量AI真实工作任务表现的GDPval测试中,GPT-5.4 Thinking得分83.0%,高于Claude Opus 4.6的78.0%与GPT-5.3 Codex的70.9%;在衡量真实软件工程问题解决能力的SWE-Bench Pro测试中得分为57.7%,与GPT-5.3 Codex基本持平;在衡量AI电脑操作能力的OSWorld-Verified测试中得分75.0%,超过Claude Opus 4.6的72.7%;在衡量Agent核心能力的ToolAthon工具使用测试中得分54.6%,远超Claude Sonnet 4.6的44.8%。

GPT-5.4结合了GPT-5.3 Codex的顶级代码能力、超越GPT-5.2的世界知识储备、更强的工具使用能力,且支持OpenAI订阅额度,价格仅为Claude Opus 4.6的一半,20美元订阅即可畅快使用,是OpenClaw的天选基座模型。该模型还带来三项核心更新:一是上下文窗口提升至100万token,远超此前的40万,可满足绝大多数Agent任务的上下文记忆需求,超过27万token后额度按双倍计算,但因OpenAI给Codex的额度充足,实际使用压力不大;二是内置原生计算机使用能力,可同时通过代码和视觉方式操控计算机、调试应用,是OpenAI首款具备该能力的主线模型;三是新增工具搜索功能,可在保持准确率不变的前提下将整体token使用量减少47%,有效降低成本、提升响应速度。

目前GPT-5.4已经上线,初步体验显示输出通俗易懂,仅在前端审美、写作风格上存在小幅不足,OpenClaw暂未完成适配,但社区先行用户普遍反馈效果良好,待适配完成后建议切换为默认模型。全文约730字,符合要求。

原文和模型


【原文链接】 阅读原文 [ 2793字 | 12分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 doubao-seed-2-0-lite-260215
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...