o1完整思维链成OpenAI头号禁忌！问多了等着封号吧

AIGC动态2年前 (2024)发布 QbitAI

4,122 0 0

文章摘要

OpenAI最近推出了一款名为o1的新型大模型，该模型在发布后不久便引发了用户和开发者社区的广泛关注和讨论。o1模型因其能够提供类似于人类思维过程的推理链而备受瞩目，但同时也因其使用条款和潜在的技术限制而受到批评。

首先，o1模型的发布伴随着一些争议。用户在尝试让模型复述其内部思维过程时，收到了OpenAI的警告邮件，提示他们的行为可能违反了使用条款，并可能导致访问权限的丧失。这种限制引发了不满，因为用户认为这限制了他们对模型内部工作机制的了解。OpenAI对此的解释是，为了监测模型的思维过程，原始的推理tokens不能加入安全限制，因此不方便公开。

其次，关于o1模型的技术细节，OpenAI透露的信息非常有限，仅提到使用了强化学习。这导致了外界对o1模型的猜测和质疑，有人认为o1可能只是基于GPT-4o的工程调整，而非全新的GPT-5模型。此外，有观点认为OpenAI隐藏模型的完整思维过程是为了保护其训练数据不被竞争对手获取。

在性能方面，o1模型在某些任务上表现出色，如在Keras之父举办的AGI Prize比赛中，o1-preview和o1-mini版本超过了GPT-4o。然而，在代码能力方面，o1并没有显示出明显的优势。在Livebench的数学和逻辑推理测试中，o1-preview虽然在代码单项上落后，但总分上超过了Claude-3.5-Sonnet。在SuperCLUE的中文复杂任务高阶推理测试中，o1-preview的推理能力也大幅领先。

尽管o1模型在某些方面表现出色，但它也存在一些限制和问题。例如，o1的成本相对较高，1百万输出tokens的费用为60美元，这使得成本回到了GPT-3时代的水平。此外，隐藏的推理tokens虽然不可见，但仍然会计入输出tokens的费用。

OpenAI的“有问必答”活动中，员工们对o1模型的一些细节进行了解释。o1代表了AI能力的一个新的层级，而preview和mini版本分别代表了不同的开发阶段和专门化程度。o1模型的运作方式被确认为是一个原生具备生成思维链能力的模型，而非简单的模型加CoT（Chain of Thought）系统。OpenAI还表示，o1模型能够处理更长的文本，并且未来将继续增加这一能力。

最后，OpenAI对o1模型的未来计划进行了一些预告，包括可能的工具调用、结构化输出、系统提示词等功能的加入，以及微调和多模态能力的实装。价格方面，OpenAI表示将遵循每1-2年降价的趋势，并在适当时候推出批量API定价。

综上所述，o1模型作为AI高阶推理的新范式，虽然在某些方面取得了显著进展，但仍有许多问题和挑战需要解决。开发者社区对o1模型的潜力和未来发展方向保持高度关注，并期待OpenAI能够提供更多的信息和改进。