OpenAI深夜发布ChatGPT Agent：能主动思考、自选工具，智能体赛道大变天

1,530 0 0

文章摘要

OpenAI在技术直播中发布了重磅产品ChatGPT Agent，标志着人工智能系统能力的新高度。ChatGPT Agent具备自主思考和行动的能力，能够从其技能库中选择合适的工具，如Operator、Deep Research和ChatGPT，以完成各种超复杂任务。用户只需提供一个提示，ChatGPT Agent便能智能地浏览网站、选择日期、筛选结果、运行代码，甚至自动生成经过润色的幻灯片演示文稿或电子表格。这一功能展示了其在处理复杂任务时的强大能力。

OpenAI首席执行官Sam Altman在长文中详细介绍了ChatGPT Agent的核心优势。该产品融合了Deep Research和Operator的核心优势，能够进行长时间思考、使用多种工具、进一步思考、采取行动，之后再深入思考，形成循环。例如，在发布会上展示了为朋友婚礼做准备的演示，包括购买服装、预订行程、挑选礼物等，以及工作场景中分析数据并制作演示文稿的案例。尽管其实用性很强，但潜在风险也不容忽视。OpenAI在系统中内置了大量安全保障和警示机制，并部署了全面的风险缓解措施，包括强化训练、系统防护和用户控制等。

ChatGPT Agent通过其虚拟计算机处理任务，能够流畅地在推理与执行之间切换，独立完成复杂的多步骤任务。其多工具集成能力将Operator的网站交互能力、Deep Research的信息整合能力以及ChatGPT的深度对话能力融合在一起，形成统一的智能体系统。此外，ChatGPT Agent还配备了多种网络工具，如可视化浏览器、文本浏览器和直接API访问权限，使其能够选择最优路径以最高效地完成任务。

在执行任务时，ChatGPT Agent能够动态学习并优化其工作方式，通过强化学习调整策略，提高任务完成的速度和准确性。该产品专为迭代式、协作式工作流程设计，显著提升了其交互性和灵活性。用户可以随时中断对话以澄清指令、重新定位任务方向，或引导其朝向预期结果，而ChatGPT智能体会从中断处继续，整合新信息，不会丢失先前进展。

在安全性方面，ChatGPT Agent的设计充分考虑了用户的安全需求。在执行涉及敏感或重要操作前，ChatGPT会明确征得用户的授权，确保用户始终掌握控制权。此外，ChatGPT Agent还具备主动监督和风险缓解功能，能够主动拒绝高风险任务，如金融交易或敏感法律互动。

根据OpenAI公布的测试数据，ChatGPT Agent在多项测试中表现优异。在“人类终极考试”中，单次尝试通过率达41.6的新SOTA成绩，采用并行策略时分数提升至44.4；在“前沿数学”基准中，准确率达27.4%，大幅超越以往模型。在模拟复杂现实世界任务的内部基准测试中，其输出在约一半案例中与人类相当或更好，显著优于o3和o4-mini，涵盖多种现实专业工作。

ChatGPT Agent的发布引发了广泛关注和期待，被视为向AGI迈进的重要一步。尽管其强大能力伴随着巨大风险，但OpenAI通过提醒和注意事项信任用户的做法得到了认可。这一产品的推出不仅展示了人工智能技术的巨大潜力，也为内容创作者和小企业简化工作流程提供了新的可能性，预示着生产力革命的开始。