o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

AIGC动态3周前发布 QbitAI
215 0 0
o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

 

文章摘要


【关 键 词】 AI大模型推理能力技术争议成本问题未来展望

OpenAI最近推出了一款名为o1的新型大模型,该模型在发布后不久便引发了用户和开发者社区的广泛关注和讨论。o1模型因其能够提供类似于人类思维过程的推理链而备受瞩目,但同时也因其使用条款和潜在的技术限制而受到批评。

首先,o1模型的发布伴随着一些争议。用户在尝试让模型复述其内部思维过程时,收到了OpenAI的警告邮件,提示他们的行为可能违反了使用条款,并可能导致访问权限的丧失。这种限制引发了不满,因为用户认为这限制了他们对模型内部工作机制的了解。OpenAI对此的解释是,为了监测模型的思维过程,原始的推理tokens不能加入安全限制,因此不方便公开。

其次,关于o1模型的技术细节,OpenAI透露的信息非常有限,仅提到使用了强化学习。这导致了外界对o1模型的猜测和质疑,有人认为o1可能只是基于GPT-4o的工程调整,而非全新的GPT-5模型。此外,有观点认为OpenAI隐藏模型的完整思维过程是为了保护其训练数据不被竞争对手获取。

在性能方面,o1模型在某些任务上表现出色,如在Keras之父举办的AGI Prize比赛中,o1-preview和o1-mini版本超过了GPT-4o。然而,在代码能力方面,o1并没有显示出明显的优势。在Livebench的数学和逻辑推理测试中,o1-preview虽然在代码单项上落后,但总分上超过了Claude-3.5-Sonnet。在SuperCLUE的中文复杂任务高阶推理测试中,o1-preview的推理能力也大幅领先。

尽管o1模型在某些方面表现出色,但它也存在一些限制和问题。例如,o1的成本相对较高,1百万输出tokens的费用为60美元,这使得成本回到了GPT-3时代的水平。此外,隐藏的推理tokens虽然不可见,但仍然会计入输出tokens的费用。

OpenAI的“有问必答”活动中,员工们对o1模型的一些细节进行了解释。o1代表了AI能力的一个新的层级,而preview和mini版本分别代表了不同的开发阶段和专门化程度。o1模型的运作方式被确认为是一个原生具备生成思维链能力的模型,而非简单的模型加CoT(Chain of Thought)系统。OpenAI还表示,o1模型能够处理更长的文本,并且未来将继续增加这一能力。

最后,OpenAI对o1模型的未来计划进行了一些预告,包括可能的工具调用、结构化输出、系统提示词等功能的加入,以及微调和多模态能力的实装。价格方面,OpenAI表示将遵循每1-2年降价的趋势,并在适当时候推出批量API定价。

综上所述,o1模型作为AI高阶推理的新范式,虽然在某些方面取得了显著进展,但仍有许多问题和挑战需要解决。开发者社区对o1模型的潜力和未来发展方向保持高度关注,并期待OpenAI能够提供更多的信息和改进。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 2510字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...