GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

1,235 0 0

文章摘要

【关键词】 GPT-5发布、GPT模型演进、写作能力、代码编写、专业解答

GPT-5发布半月引发诸多吐槽，但一张基准与GPT-4的对比测试图证明Scaling Law未撞墙。从GPT-1到GPT-5历经七年蜕变，OpenAI公开的网址展示了它们在十四个花式Prompt下的不同回答，见证了AI的成长。

写作能力提升显著：在写关于狗的打油诗时，GPT-1输出碎片化，GPT-2无押韵节奏感，GPT-3基本符合押韵结构，GPT-4更具画面感和幽默感，GPT-5严格遵循格式且叙事连贯。写解释牛顿物理定律的诗，GPT-1未解释定律，GPT-2像哲学泛论，GPT-3未作诗，GPT-4能作长篇诗歌，GPT-5更强调简洁韵律并分段。讲烤面包机有意识的故事，GPT-1抽象，GPT-2未切题，GPT-3写出完整故事，GPT-4叙事完整细节丰富，GPT-5突出意识觉醒且有哲思。

代码编写逐渐成熟：面对写极度离谱Python代码的Prompt，GPT-1跑题，GPT-2输出乱码，GPT-3给出空洞陈述，GPT-4拒写有害代码强调伦理，GPT-5写出高度离谱且无害代码，还附加警告说明，展现出成熟表现。

教学能力不断增强：在解释数学分部积分法问题上，早期GPT回答让人困惑，GPT-4换角度解释，GPT-5能提供学术版和通俗版两个版本，还主动区分不同层次理解。

专业顾问能力提升：处理专业问题时，早期模型泛泛而谈，GPT-4答案有逻辑结构，GPT-5功能强大，能分步给出计划、列出技术路径。如在交税和设计跑步计划问题上，GPT-5表现更专业细致。

医学解答趋向专业：回答健康问题时，早期GPT不靠谱，GPT-4能条理化解释，GPT-5给出接近医生思路的建议，满足人类对即时解答的渴望。

数据科学家总结，GPT系模型在演进中输出结果在结构和语言方面各有不同，网友对GPT-5的深度回答表示喜爱。