OpenAI 发布最新模型 o1,这次变为华人扛大旗?一分钟搞出 3D 版贪吃蛇,好用但小贵

AIGC动态3周前发布 ai-front
158 0 0
OpenAI 发布最新模型 o1,这次变为华人扛大旗?一分钟搞出 3D 版贪吃蛇,好用但小贵

 

文章摘要


【关 键 词】 AI推理模型对比编程竞赛技术优化华人贡献

OpenAI于9月12日推出了名为“草莓”(Strawberry)的o1模型,这是其推理模型家族的首个成员,旨在解决科学、编码和数学等领域的复杂问题,这些问题对于现有AI模型来说难以攻克,包括OpenAI自家强大的GPT-4o模型。o1模型通过推理拆解问题,模仿人类的思维步骤来得出正确结果,与GPT-4o相比,虽然价格更高、生成速度较慢,但提供了更深入的解决方案。

o1模型的编码和数理能力显著提升,有用户在社交平台上展示了其在一分钟内创建3D版贪吃蛇游戏的能力。此外,还有用户通过结合o1和Cursor Composer,在10分钟内为iOS创建了一个带有动画的完整天气应用程序。o1模型在解决美国数学邀请赛(AIME)的问题时,正确率高达83.3%,远超GPT-4o的13.4%。在Codeforces在线编程竞赛中,o1模型的排名位于参赛者中的第89百分位。

OpenAI还推出了更小、更便宜的o1-mini版本,适用于需要推理但不需要广泛世界知识的应用程序。o1模型的推理界面能够展示模型的思考过程,如“我很好奇”、“我正在认真思考”等,营造出模型在分步推理的感觉。OpenAI的研究负责人Jerry Tworek指出,o1模型使用了一种全新的优化训练算法和定制的训练数据集,通过强化学习技术训练模型自主解决问题。

尽管o1模型在某些方面表现出色,但也存在局限性,例如无法浏览网页或接收上传的文件和图像。在定价方面,o1模型的费用大约是GPT-4o的3.5倍。OpenAI计划将o1-mini的访问权限向全体ChatGPT用户免费开放,但具体发布日期尚未确定。o1模型背后的研究团队中,有多位华人开发者的贡献。

OpenAI的首席技术官Mira Murati表示,公司正在构建下一代主模型GPT-5,它将在体量上远超前身,并可能融入推理技术。新模型的发布标志着生成式AI在方法论层面的转变,展示了AI模型不偏离正确行为轨道的能力。其他竞争对手如谷歌也在进行类似的研究,而OpenAI的研究副总裁Mark Chen认为,新推理方法表明推进AI发展并不一定需要耗费大量算力。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 4227字 | 17分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...