GPT-5.4深夜发布，最适合OpenClaw的天选模型登场了。

43 0 0

文章摘要

【关键词】 GPT-5.4、OpenClaw、基座模型、代码能力、价格优势

开发OpenClaw工具的团队长期在Agent基座模型选择上陷入困境，原有的Claude Opus 4.6综合能力达标，可满足Agent开发的需求，但API价格高昂，且无法使用订阅额度，此前可用的反代调用途径也因平台封号政策无法继续使用；此前OpenAI推出的GPT-5.3-Codex代码能力出众，但属于编程特化模型，世界知识储备不足，输出晦涩难懂，无法作为默认模型使用，GPT-5.2又存在代码能力不足的短板，因此一直期待能补足短板的新OpenAI模型。

一款合格的顶级Agent基座模型，需要同时具备出色的代码能力、充足的世界知识、优秀的多模态理解，同时价格亲民，支持第三方工具调用。此次发布的GPT-5.4各项核心跑分表现优异，完全符合需求：在衡量AI真实工作任务表现的GDPval测试中，GPT-5.4 Thinking得分83.0%，高于Claude Opus 4.6的78.0%与GPT-5.3 Codex的70.9%；在衡量真实软件工程问题解决能力的SWE-Bench Pro测试中得分为57.7%，与GPT-5.3 Codex基本持平；在衡量AI电脑操作能力的OSWorld-Verified测试中得分75.0%，超过Claude Opus 4.6的72.7%；在衡量Agent核心能力的ToolAthon工具使用测试中得分54.6%，远超Claude Sonnet 4.6的44.8%。

GPT-5.4结合了GPT-5.3 Codex的顶级代码能力、超越GPT-5.2的世界知识储备、更强的工具使用能力，且支持OpenAI订阅额度，价格仅为Claude Opus 4.6的一半，20美元订阅即可畅快使用，是OpenClaw的天选基座模型。该模型还带来三项核心更新：一是上下文窗口提升至100万token，远超此前的40万，可满足绝大多数Agent任务的上下文记忆需求，超过27万token后额度按双倍计算，但因OpenAI给Codex的额度充足，实际使用压力不大；二是内置原生计算机使用能力，可同时通过代码和视觉方式操控计算机、调试应用，是OpenAI首款具备该能力的主线模型；三是新增工具搜索功能，可在保持准确率不变的前提下将整体token使用量减少47%，有效降低成本、提升响应速度。

目前GPT-5.4已经上线，初步体验显示输出通俗易懂，仅在前端审美、写作风格上存在小幅不足，OpenClaw暂未完成适配，但社区先行用户普遍反馈效果良好，待适配完成后建议切换为默认模型。全文约730字，符合要求。