OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

2,516 0 0

文章摘要

OpenAI于7月18日推出了GPT-4o mini，标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应，这些团队已在此领域研究了大半年。GPT-4o mini的发布不仅显示了端侧模型和智能小模型的发展趋势，也引发了对小模型未来价值的讨论。

AI技术专家Andrej Karpathy认为，未来将出现参数规模小但思考能力强的小模型，这将是AI大模型的最终目标。他指出，目前AI模型之所以“大”，是因为训练方法不够高效。面壁智能团队也表达了相似观点，并提出了“面壁定律”，即模型参数规模随时间递减，但智能水平不断上升。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小模型。它支持的语言范围与GPT-4o相同，且长上下文性能有所提高。在大规模多任务语言理解（MMLU）测试中，GPT-4o mini的得分为82%，显示出其强大的语言理解和使用能力。

OpenAI表示，GPT-4o mini的成本比GPT-3.5 Turbo便宜超过60%，并向免费版、Plus版和团队版的ChatGPT用户开放。这一举措可能是为了吸引那些无法承担大模型昂贵费用的开发者，为他们提供更轻量且廉价的工具。

国产大模型团队在小模型领域也取得了显著成果。例如，商汤科技发布了1.8B参数规模的SenseChat-Lite版本，上海人工智能实验室OpenGV Lab推出了多模态小模型系列，面壁智能则在小模型上取得了知识密度的显著提升。

小模型的崛起带来了行业变化，如端侧模型的兴起和开源社区的形成。端侧模型需要与具体行业和领域相结合，同时需要丰富的训练数据和完善的数据工程系统。小模型的开源社区使更多高校科研人员能够参与研究，增加了竞争压力。

OpenAI发布GPT-4o mini可能是大模型价格战的缩影，对云端API市场造成冲击。端侧大模型的兴起为应用公司提供了智能化底座，但同时也带来了推理成本的挑战。国产大模型团队在小模型领域的技术成果值得关注，显示了国产大模型技术的快速发展。

原文和模型

【原文链接】 阅读原文 [ 3603字 | 15分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # GPT-GPTs # 大模型 # GPT-4o mini # 多模态 # 小模型 # 成本降低 # 智能提升

文章版权归作者所有，未经允许请勿转载。

「拍照问夸克」，从「Know-What」到「Get it Done」的跃迁

极客公园

879

海外热议！百度双模型免费上线，实测可帮没看“3.15”的打工人避雷

AI前线

1,136

给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果

机器之心

2,083

让奥特曼直呼“天才”的o3 和 o4-mini，被曝捏造事实问题严重！拓展强化学习、图像思维链等亮点成陪衬？

AI前线

888

商汤生成式AI收入超10亿元，同比增长256%

AIGC开放社区

1,220

刚刚，o4-mini发布！OpenAI史上最强、最智能模型

AIGC开放社区

1,036

暂无评论

暂无评论...

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

文章摘要

原文和模型

GPT-4o mini背后团队揭秘：9人团华人面孔过半，清华北大同济校友在列

香港理工大学 MIND 实验室招收进化计算/类脑计算/语音信号处理等方向全奖博士生/博士后

相关文章

暂无评论

热门网址

热门文章

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

文章摘要

原文和模型

GPT-4o mini背后团队揭秘：9人团华人面孔过半，清华北大同济校友在列

香港理工大学 MIND 实验室招收进化计算/类脑计算/语音信号处理等方向全奖博士生/博士后

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章