GPT-5.2获封“最强打工人”，谷歌同日以Gemini“性价比”系列应战

534 0 0

文章摘要

OpenAI在成立十周年之际发布了GPT-5.2大模型，CEO萨姆·奥尔特曼在纪念文章中表达了对公司研发方向的强烈信心。尽管面临DeepSeek、Grok、Claude等竞争对手的追赶，尤其是谷歌Gemini 3的出色表现，OpenAI仍希望通过GPT-5.2重新确立技术领先地位。该模型分为Instant、Thinking和Pro三个层级，评测表现全面超越Gemini 3 PRO和Claude Opus 4.5，尤其在博士级推理评估GPQA Diamond中得分高达92.4%，并在美国数学邀请赛中取得满分。

GPT-5.2在专业工作场景中展现出显著优势，被OpenAI称为“目前最能够胜任现实中各类专业用途的模型”。在GDPval测试中，该模型得分比前代提升32.1%，领先Gemini 3 PRO达17.4%。实际应用中，GPT-5.2在代码编写、PPT制作、图像感知等任务中表现优异，错误率大幅降低，被用户誉为“最强AI打工人”。然而，其高昂的使用成本引发担忧，输入输出价格比前代上涨40%，输出价格高达168美元，算力依赖问题再次成为焦点。

谷歌在GPT-5.2发布前一小时抢先推出Gemini Deep Research智能体，基于Gemini 3 PRO构建，在复杂研究任务中精度更高，成本仅为GPT-5 Pro的十分之一，凸显性价比优势。该智能体在人类终极大考（HLE）中得分略高于GPT-5.2 Thinking，同时谷歌开源了DeepSearchQA基准测试工具，进一步巩固其技术生态。

大模型竞争已延伸至底层硬件领域，英伟达在与美银的交流中强调，新一代Blackwell和Rubin芯片的潜力尚未完全释放。公司认为当前模型性能对比不能直接反映芯片代际差异，2026年新芯片投入使用后竞争格局可能重塑。这场技术角逐不仅关乎模型能力，更涉及训练路径和硬件创新的战略选择。

随着OpenAI加速开发全新模型“Garlic”，以及谷歌、Anthropic等持续创新，2026年AI领域的竞争将进一步激化。行业正面临性能突破与成本效益的双重考验，技术路线和商业模式的博弈将持续影响市场格局。