你是一个成熟的Agent了,该自己报道ChatGPT Agent的新闻了

AI-Agent15小时前发布 Si-Planet
77 0 0
你是一个成熟的Agent了,该自己报道ChatGPT Agent的新闻了

 

文章摘要


【关 键 词】 AIAgent竞争应用技术

OpenAI于7月18日凌晨发布了ChatGPT Agent,这是其在AI Agent化道路上的又一重要举措。当前,AI Agent领域正逐渐分化为两大流派:以OpenAI和Claude为代表的“基座派”,致力于将Agent能力融入底层模型;另一派则是“应用派”,专注于在具体应用场景和灵活工具调用上的设计规划。自3月Manus推出以来,通用Agent市场迅速升温,Genspark、Flowith、Fellou等新锐玩家纷纷从不同场景切入,形成了各自的阵营。

在ChatGPT Agent发布后不久,Genspark在社交平台X上公开质疑其表现,Manus也对比了自身与OpenAI的案例结果。为了进一步比较这些产品的表现,我们让多个AI Agent产品报道ChatGPT Agent的发布,并要求它们以深度报告的形式输出结果。Manus的Agent在分析后对OpenAI给出了更高的评价,Genspark则生成了更复杂的报告,并对OpenAI表达了高度认可。Flowith则抓住了制作one pager的重点,交出了设计感较强的结果。

随后,我们让这些AI Agent处理OpenAI视频中展示的案例,包括婚礼规划和贴纸设计等场景。在婚礼规划任务中,Manus输出了长文本页面,但未提供具体购买链接;Flowith同样给出了详细指南,但因任务线bug未能输出服饰结果;Fellou则耗时1小时14分钟,认真比较了行程、路线和酒店信息,最终以简单设计的格式提供报告,但同样无法直接购买。在贴纸设计任务中,Genspark和Flowith只能提供订购指导,而Manus则完成了购物车添加,成为除OpenAI外唯一进行到这一步的Agent。

当前的AI Agent仍处于“混沌期”,其能力令人惊叹,但稳定性仍有待提升。OpenAI此次发布的ChatGPT Agent更像是一个占位动作,但随着更多重要玩家的加入和竞争的加剧,AI Agent领域将迎来更快速的发展。最终,这些努力将推动一个能够稳定解决人类复杂任务的Agent更早出现在我们的生活中。

原文和模型


【原文链接】 阅读原文 [ 1538字 | 7分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...