OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破

AI-Agent41分钟前发布 AIera
43 0 0
OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破

 

文章摘要


【关 键 词】 OpenAI预训练谷歌TPUGPT-5技术瓶颈

OpenAI在GPT-4o发布后,其预训练进展陷入停滞,导致GPT-5的性能未达业界预期。据权威分析机构SemiAnalysis披露,OpenAI顶尖团队自2024年5月以来未能完成新一代前沿模型的大规模预训练,而谷歌则凭借TPUv7在预训练领域取得突破,威胁到英伟达的硬件主导地位。预训练作为大模型开发的核心环节,其停滞直接影响了OpenAI的技术迭代能力。内部资料显示,GPT-5的技术根基仍基于GPT-4o框架,未实现全新架构的突破,这解释了其被业界评价为“GPT-4.5优化版”而非“颠覆性产品”的原因。

GPT-4.5项目“Orion”的失败暴露了OpenAI在预训练领域的困境。该项目原计划作为GPT-5发布,但因训练效果未达预期,最终降级为GPT-4.5。其训练周期远超行业常规的1-3个月,且性能提升主要集中在语言能力,代码能力反而退步。这一结果印证了此前外媒关于OpenAI预训练“触及天花板”的猜测。值得注意的是,前首席科学家Ilya Sutskever的离职时间与预训练停滞期重合,其近期发文暗示“Scaling持续但关键要素缺失”,进一步引发行业联想。

谷歌Gemini 3的强势表现加剧了OpenAI的竞争压力。OpenAI CEO奥特曼在内部备忘录中罕见承认谷歌在预训练领域的领先优势,同时披露公司正转向“推理模型”架构的研发。技术分析指出,GPT-5实际消耗的训练算力可能低于前代GPT-4.5,这与行业“更多算力带来更强性能”的常规认知相悖。为扭转局面,OpenAI已启动代号“Shallotpeat”的新项目,旨在解决预训练中的技术瓶颈

OpenAI战略重心正从“单一超级模型”转向专业化分工。平台工程负责人Sherwin Wu透露,公司已放弃早期“通用模型统治一切”的理念,转而推动模型细分领域的定制化。强化学习微调(RFT)成为企业利用私有数据训练专属模型的核心技术,而智能体(Agent)开发则分化为探索型与流程型两类。后者强调通过硬编码逻辑框架(非提示词)实现可控行为,尤其适用于金融、客服等强监管场景。

面对谷歌的攻势,OpenAI计划在2024年底密集发布多款新模型,包括图像生成v2、多模态竞赛模型及GPT-5.2 Codex。但行业观察者指出,除非突破预训练瓶颈,否则技术代差可能持续扩大。目前,OpenAI的“博士级AI”宣传与GPT-5实际表现之间的落差,已引发技术社区对其创新能力的质疑。

原文和模型


【原文链接】 阅读原文 [ 2881字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...