刚刚，谷歌祭出迄今最前沿模型 Gemini 3 Flash！编程能力上反超 Gemini 3 Pro，且更快更便宜

548 0 0

文章摘要

谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash，该模型专为速度设计，旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测试中表现出前沿性能，例如在GPQA Diamond测试中达到90.4%，在Humanity’s Last Exam中得分为33.7%（不使用工具），与规模更大的前沿模型性能相当。此外，它在MMMU Pro测试中取得了81.2%的成绩，与Gemini 3 Pro的性能接近。

Gemini 3 Flash在性能、成本和速度方面突破了帕累托极限。其速度比前代Gemini 2.5 Pro快3倍，而价格更低。具体定价为每百万个输入token 0.50美元，每百万个输出token 3美元。尽管价格略高于Gemini Flash 2.5，但谷歌强调新模型的性能更优，且在处理思维任务时平均比2.5 Pro少用30%的token，从而在某些任务中为用户节省成本。

在编程性能上，Gemini 3 Flash展现了专业级的编码能力，延迟极低。在SWE-bench Verified基准测试中，其得分高达78%，超越了Gemini 2.5系列和Gemini 3 Pro。该模型特别适合复杂的视频分析、数据提取和视觉问答等应用场景，能够实现近乎实时的多模态推理，例如在手部追踪的益智游戏中提供实时AI辅助。

Gemini 3 Flash已作为搜索中AI模式的默认模型推出，全球用户均可使用。其AI模式基于Gemini 3 Pro的推理能力，能够更有效地解析用户问题的细微差别，提供周全且易于理解的答案。谷歌将Gemini Flash定位为“主力机型”，而非高端展示型模型，强调其更适合大规模、批量化的任务处理需求，帮助企业降低使用门槛和整体成本。

自Gemini 3发布以来，谷歌API上的处理规模迅速扩大，每日处理的token数量已超过1万亿个。与此同时，谷歌与OpenAI的竞争日益激烈。OpenAI近期发布了GPT-5.2和新的图像生成模型，并强调企业级应用需求的增长。尽管谷歌未直接回应竞争关系，但其认为新模型的密集发布正在推动整个行业加速发展。

Gemini 3 Flash的发布引发了广泛讨论。部分开发者认为其准确度与Gemini 3 Pro相当，但价格更低、速度更快。然而，也有用户对基准测试成绩的真实性提出质疑，认为实际应用场景远比测试样本复杂。尽管如此，谷歌通过频繁发布新模型和优化性能，进一步巩固了其在AI领域的领先地位。