OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

867 0 0

文章摘要

OpenAI在GPT-4o发布后，其预训练进展陷入停滞，导致GPT-5的性能未达业界预期。据权威分析机构SemiAnalysis披露，OpenAI顶尖团队自2024年5月以来未能完成新一代前沿模型的大规模预训练，而谷歌则凭借TPUv7在预训练领域取得突破，威胁到英伟达的硬件主导地位。预训练作为大模型开发的核心环节，其停滞直接影响了OpenAI的技术迭代能力。内部资料显示，GPT-5的技术根基仍基于GPT-4o框架，未实现全新架构的突破，这解释了其被业界评价为“GPT-4.5优化版”而非“颠覆性产品”的原因。

GPT-4.5项目“Orion”的失败暴露了OpenAI在预训练领域的困境。该项目原计划作为GPT-5发布，但因训练效果未达预期，最终降级为GPT-4.5。其训练周期远超行业常规的1-3个月，且性能提升主要集中在语言能力，代码能力反而退步。这一结果印证了此前外媒关于OpenAI预训练“触及天花板”的猜测。值得注意的是，前首席科学家Ilya Sutskever的离职时间与预训练停滞期重合，其近期发文暗示“Scaling持续但关键要素缺失”，进一步引发行业联想。

谷歌Gemini 3的强势表现加剧了OpenAI的竞争压力。OpenAI CEO奥特曼在内部备忘录中罕见承认谷歌在预训练领域的领先优势，同时披露公司正转向“推理模型”架构的研发。技术分析指出，GPT-5实际消耗的训练算力可能低于前代GPT-4.5，这与行业“更多算力带来更强性能”的常规认知相悖。为扭转局面，OpenAI已启动代号“Shallotpeat”的新项目，旨在解决预训练中的技术瓶颈。

OpenAI战略重心正从“单一超级模型”转向专业化分工。平台工程负责人Sherwin Wu透露，公司已放弃早期“通用模型统治一切”的理念，转而推动模型细分领域的定制化。强化学习微调（RFT）成为企业利用私有数据训练专属模型的核心技术，而智能体（Agent）开发则分化为探索型与流程型两类。后者强调通过硬编码逻辑框架（非提示词）实现可控行为，尤其适用于金融、客服等强监管场景。

面对谷歌的攻势，OpenAI计划在2024年底密集发布多款新模型，包括图像生成v2、多模态竞赛模型及GPT-5.2 Codex。但行业观察者指出，除非突破预训练瓶颈，否则技术代差可能持续扩大。目前，OpenAI的“博士级AI”宣传与GPT-5实际表现之间的落差，已引发技术社区对其创新能力的质疑。