超越GPT-4，Claude 3超大杯成新王！

AIGC动态2年前 (2024)发布 AIera

3,594 0 0

文章摘要

【关键词】 Claude 3 Opus、GPT-4、Chatbot Arena、聊天机器人、ChatGPT

最近，Chatbot Arena的聊天机器人对战排行榜更新，Claude 3 Opus成功超越了GPT-4，成为新的领导者。

这个排行榜的权威性在于，每个模型的得分完全取决于真实人类用户的使用体验。用户会同时向两个匿名模型提出相同的问题，然后根据回答投票给表现更好的模型。如果一次回答不能确定，用户可以继续聊天，直到确定获胜者。如果在对话中透露了模型的身份，则不会计算投票。

Claude 3家族的整体表现都非常亮眼，其中Claude 3 Sonnet排到了第4，而最小的Claude 3 HaiKu也达到了GPT-4水平。Claude 3 Haiku不仅与原始版本的GPT-4表现一样好，关键是相当便宜，在一些平台你甚至可以免费使用。

然而，ChatGPT的情况并不乐观。最近一段时间，ChatGPT一直被指责懒惰、系统提示臃肿，而另一方面竞争也愈演愈烈。Claude 3和Gemini Pro 1.5现在都提供了比GPT-4多8倍的上下文长度和更好的recall能力。对于几乎每个ChatGPT用例，现在都有大量垂直化的AI初创公司，致力于满足用户的需求，而不是满足于现有的ChatGPT界面和捆绑工具。

OpenAI的B2B和B2C部分相互竞争，这在某种程度上是良性竞争。OpenAI可以使用来自ChatGPT的RLHF数据进行训练。而新的GPT商店可以看作是，OpenAI为了抓住这些垂直化需求的尝试。大部分创作者也很明智，一般只向ChatGPT发布精简版的应用，作为自己主要平台的一个渠道。

总的来说，Claude 3 Opus的成功超越GPT-4，标志着聊天机器人领域的新变化。而ChatGPT的未来发展，可能会以平台专属模型为特色，以此来抓住垂直化需求的机会。