神秘大模型一夜刷屏，能力太强被疑GPT-4.5，奥特曼避而不答打哑谜

AIGC动态2年前 (2024)发布 QbitAI

3,775 0 0

文章摘要

一款名为“gpt2-chatbot”的神秘模型突然成为了大模型领域的焦点，其能力超越了包括GPT-4在内的多个开源模型。这款模型在解决问题和推理方面表现出色，例如能够一次性正确回答国际数学奥林匹克竞赛的题目，生成旋转的3D立方体，并且在逻辑陷阱问题上能够给出合理的回答。

gpt2-chatbot的中文能力也很强，能够理解并准确回答中文问题，显示出它可能不是基于Llama 3微调的模型。它能够提供详细的知识信息，如地理距离、世界纪录和商品价格等。在测试中，gpt2-chatbot透露自己是由OpenAI训练的，基于GPT-4架构，并且具备接受图像输入的能力。

目前，唯一已知的测试gpt2-chatbot的方式是通过LMSYS大模型竞技场的Direct Chat功能，但每人每天的消息数量和全局的消息限制都非常有限。在测试中，gpt2-chatbot的回答在不同时间和地点都是一致的，这表明它是一个稳定的模型。

关于gpt2-chatbot的身份，有多种猜测。一些人认为它可能是匿名发布的GPT-4.5或GPT-4的原始版本，经过不同的对齐训练。另一种猜测是，它可能是LMSYS组织基于2019年的GPT-2架构训练的模型，这一猜测的依据是一篇论文声称GPT-2在某些情况下的能力超过了多个现代模型，而该论文的一位作者与LMSYS的赞助商MBZUAI（阿联酋人工智能大学）有关联。尽管存在这些猜测，gpt2-chatbot的真实身份仍然是一个谜。