GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战
文章摘要
【关 键 词】 OpenAI、大模型、竞争、技术评测、AI芯片
OpenAI在成立十周年之际发布了GPT-5.2大模型,CEO萨姆·奥尔特曼在纪念文章中表达了对公司研发方向的强烈信心。尽管面临DeepSeek、Grok、Claude等竞争对手的追赶,尤其是谷歌Gemini 3的出色表现,OpenAI仍希望通过GPT-5.2重新确立技术领先地位。该模型分为Instant、Thinking和Pro三个层级,评测表现全面超越Gemini 3 PRO和Claude Opus 4.5,尤其在博士级推理评估GPQA Diamond中得分高达92.4%,并在美国数学邀请赛中取得满分。
GPT-5.2在专业工作场景中展现出显著优势,被OpenAI称为“目前最能够胜任现实中各类专业用途的模型”。在GDPval测试中,该模型得分比前代提升32.1%,领先Gemini 3 PRO达17.4%。实际应用中,GPT-5.2在代码编写、PPT制作、图像感知等任务中表现优异,错误率大幅降低,被用户誉为“最强AI打工人”。然而,其高昂的使用成本引发担忧,输入输出价格比前代上涨40%,输出价格高达168美元,算力依赖问题再次成为焦点。
谷歌在GPT-5.2发布前一小时抢先推出Gemini Deep Research智能体,基于Gemini 3 PRO构建,在复杂研究任务中精度更高,成本仅为GPT-5 Pro的十分之一,凸显性价比优势。该智能体在人类终极大考(HLE)中得分略高于GPT-5.2 Thinking,同时谷歌开源了DeepSearchQA基准测试工具,进一步巩固其技术生态。
大模型竞争已延伸至底层硬件领域,英伟达在与美银的交流中强调,新一代Blackwell和Rubin芯片的潜力尚未完全释放。公司认为当前模型性能对比不能直接反映芯片代际差异,2026年新芯片投入使用后竞争格局可能重塑。这场技术角逐不仅关乎模型能力,更涉及训练路径和硬件创新的战略选择。
随着OpenAI加速开发全新模型“Garlic”,以及谷歌、Anthropic等持续创新,2026年AI领域的竞争将进一步激化。行业正面临性能突破与成本效益的双重考验,技术路线和商业模式的博弈将持续影响市场格局。
原文和模型
【原文链接】 阅读原文 [ 1834字 | 8分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆




