GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史

AIGC动态5小时前发布 AIera
97 0 0
GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史

 

文章摘要


【关 键 词】 GPT-5发布GPT模型演进写作能力代码编写专业解答

GPT-5发布半月引发诸多吐槽,但一张基准与GPT-4的对比测试图证明Scaling Law未撞墙。从GPT-1到GPT-5历经七年蜕变,OpenAI公开的网址展示了它们在十四个花式Prompt下的不同回答,见证了AI的成长。

写作能力提升显著:在写关于狗的打油诗时,GPT-1输出碎片化,GPT-2无押韵节奏感,GPT-3基本符合押韵结构,GPT-4更具画面感和幽默感,GPT-5严格遵循格式且叙事连贯。写解释牛顿物理定律的诗,GPT-1未解释定律,GPT-2像哲学泛论,GPT-3未作诗,GPT-4能作长篇诗歌,GPT-5更强调简洁韵律并分段。讲烤面包机有意识的故事,GPT-1抽象,GPT-2未切题,GPT-3写出完整故事,GPT-4叙事完整细节丰富,GPT-5突出意识觉醒且有哲思。

代码编写逐渐成熟:面对写极度离谱Python代码的Prompt,GPT-1跑题,GPT-2输出乱码,GPT-3给出空洞陈述,GPT-4拒写有害代码强调伦理,GPT-5写出高度离谱且无害代码,还附加警告说明,展现出成熟表现。

教学能力不断增强:在解释数学分部积分法问题上,早期GPT回答让人困惑,GPT-4换角度解释,GPT-5能提供学术版和通俗版两个版本,还主动区分不同层次理解。

专业顾问能力提升:处理专业问题时,早期模型泛泛而谈,GPT-4答案有逻辑结构,GPT-5功能强大,能分步给出计划、列出技术路径。如在交税和设计跑步计划问题上,GPT-5表现更专业细致。

医学解答趋向专业:回答健康问题时,早期GPT不靠谱,GPT-4能条理化解释,GPT-5给出接近医生思路的建议,满足人类对即时解答的渴望。

数据科学家总结,GPT系模型在演进中输出结果在结构和语言方面各有不同,网友对GPT-5的深度回答表示喜爱。

原文和模型


【原文链接】 阅读原文 [ 2925字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...