刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜

AIGC动态9小时前发布 ai-front
84 0 0
刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜

 

文章摘要


【关 键 词】 谷歌Gemini人工智能模型发布技术竞争

谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash,该模型专为速度设计,旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测试中表现出前沿性能,例如在GPQA Diamond测试中达到90.4%,在Humanity’s Last Exam中得分为33.7%(不使用工具),与规模更大的前沿模型性能相当。此外,它在MMMU Pro测试中取得了81.2%的成绩,与Gemini 3 Pro的性能接近。

Gemini 3 Flash在性能、成本和速度方面突破了帕累托极限。其速度比前代Gemini 2.5 Pro快3倍,而价格更低。具体定价为每百万个输入token 0.50美元,每百万个输出token 3美元。尽管价格略高于Gemini Flash 2.5,但谷歌强调新模型的性能更优,且在处理思维任务时平均比2.5 Pro少用30%的token,从而在某些任务中为用户节省成本。

在编程性能上,Gemini 3 Flash展现了专业级的编码能力,延迟极低。在SWE-bench Verified基准测试中,其得分高达78%,超越了Gemini 2.5系列和Gemini 3 Pro。该模型特别适合复杂的视频分析、数据提取和视觉问答等应用场景,能够实现近乎实时的多模态推理,例如在手部追踪的益智游戏中提供实时AI辅助。

Gemini 3 Flash已作为搜索中AI模式的默认模型推出,全球用户均可使用。其AI模式基于Gemini 3 Pro的推理能力,能够更有效地解析用户问题的细微差别,提供周全且易于理解的答案。谷歌将Gemini Flash定位为“主力机型”,而非高端展示型模型,强调其更适合大规模、批量化的任务处理需求,帮助企业降低使用门槛和整体成本。

自Gemini 3发布以来,谷歌API上的处理规模迅速扩大,每日处理的token数量已超过1万亿个。与此同时,谷歌与OpenAI的竞争日益激烈。OpenAI近期发布了GPT-5.2和新的图像生成模型,并强调企业级应用需求的增长。尽管谷歌未直接回应竞争关系,但其认为新模型的密集发布正在推动整个行业加速发展。

Gemini 3 Flash的发布引发了广泛讨论。部分开发者认为其准确度与Gemini 3 Pro相当,但价格更低、速度更快。然而,也有用户对基准测试成绩的真实性提出质疑,认为实际应用场景远比测试样本复杂。尽管如此,谷歌通过频繁发布新模型和优化性能,进一步巩固了其在AI领域的领先地位。

原文和模型


【原文链接】 阅读原文 [ 2458字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...