OpenAI深夜发布ChatGPT Agent:能主动思考、自选工具,智能体赛道大变天

AI-Agent1天前发布 AIGCOPEN
126 0 0
OpenAI深夜发布ChatGPT Agent:能主动思考、自选工具,智能体赛道大变天

 

文章摘要


【关 键 词】 AI技术创新安全应用

OpenAI技术直播中发布了重磅产品ChatGPT Agent,标志着人工智能系统能力的新高度。ChatGPT Agent具备自主思考和行动的能力,能够从其技能库中选择合适的工具,如Operator、Deep Research和ChatGPT,以完成各种超复杂任务。用户只需提供一个提示,ChatGPT Agent便能智能地浏览网站、选择日期、筛选结果、运行代码,甚至自动生成经过润色的幻灯片演示文稿或电子表格。这一功能展示了其在处理复杂任务时的强大能力。

OpenAI首席执行官Sam Altman在长文中详细介绍了ChatGPT Agent的核心优势。该产品融合了Deep Research和Operator的核心优势,能够进行长时间思考、使用多种工具、进一步思考、采取行动,之后再深入思考,形成循环。例如,在发布会上展示了为朋友婚礼做准备的演示,包括购买服装、预订行程、挑选礼物等,以及工作场景中分析数据并制作演示文稿的案例。尽管其实用性很强,但潜在风险也不容忽视。OpenAI在系统中内置了大量安全保障和警示机制,并部署了全面的风险缓解措施,包括强化训练、系统防护和用户控制等。

ChatGPT Agent通过其虚拟计算机处理任务,能够流畅地在推理与执行之间切换,独立完成复杂的多步骤任务。其多工具集成能力将Operator的网站交互能力、Deep Research的信息整合能力以及ChatGPT的深度对话能力融合在一起,形成统一的智能体系统。此外,ChatGPT Agent还配备了多种网络工具,如可视化浏览器、文本浏览器和直接API访问权限,使其能够选择最优路径以最高效地完成任务。

在执行任务时,ChatGPT Agent能够动态学习并优化其工作方式,通过强化学习调整策略,提高任务完成的速度和准确性。该产品专为迭代式、协作式工作流程设计,显著提升了其交互性和灵活性。用户可以随时中断对话以澄清指令、重新定位任务方向,或引导其朝向预期结果,而ChatGPT智能体会从中断处继续,整合新信息,不会丢失先前进展。

在安全性方面,ChatGPT Agent的设计充分考虑了用户的安全需求。在执行涉及敏感或重要操作前,ChatGPT会明确征得用户的授权,确保用户始终掌握控制权。此外,ChatGPT Agent还具备主动监督和风险缓解功能,能够主动拒绝高风险任务,如金融交易或敏感法律互动。

根据OpenAI公布的测试数据,ChatGPT Agent在多项测试中表现优异。在“人类终极考试”中,单次尝试通过率达41.6的新SOTA成绩,采用并行策略时分数提升至44.4;在“前沿数学”基准中,准确率达27.4%,大幅超越以往模型。在模拟复杂现实世界任务的内部基准测试中,其输出在约一半案例中与人类相当或更好,显著优于o3和o4-mini,涵盖多种现实专业工作。

ChatGPT Agent的发布引发了广泛关注和期待,被视为向AGI迈进的重要一步。尽管其强大能力伴随着巨大风险,但OpenAI通过提醒和注意事项信任用户的做法得到了认可。这一产品的推出不仅展示了人工智能技术的巨大潜力,也为内容创作者和小企业简化工作流程提供了新的可能性,预示着生产力革命的开始。

原文和模型


【原文链接】 阅读原文 [ 2320字 | 10分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...