超越GPT-4,Claude 3超大杯成新王!

AIGC动态4个月前发布 AIera
378 0 0
超越GPT-4,Claude 3超大杯成新王!

 

文章摘要


【关 键 词】 Claude 3 OpusGPT-4Chatbot Arena聊天机器人ChatGPT

最近,Chatbot Arena聊天机器人对战排行榜更新,Claude 3 Opus成功超越了GPT-4,成为新的领导者。

这个排行榜的权威性在于,每个模型的得分完全取决于真实人类用户的使用体验。用户会同时向两个匿名模型提出相同的问题,然后根据回答投票给表现更好的模型。如果一次回答不能确定,用户可以继续聊天,直到确定获胜者。如果在对话中透露了模型的身份,则不会计算投票。

Claude 3家族的整体表现都非常亮眼,其中Claude 3 Sonnet排到了第4,而最小的Claude 3 HaiKu也达到了GPT-4水平。Claude 3 Haiku不仅与原始版本的GPT-4表现一样好,关键是相当便宜,在一些平台你甚至可以免费使用。

然而,ChatGPT的情况并不乐观。最近一段时间,ChatGPT一直被指责懒惰、系统提示臃肿,而另一方面竞争也愈演愈烈。Claude 3和Gemini Pro 1.5现在都提供了比GPT-4多8倍的上下文长度和更好的recall能力。对于几乎每个ChatGPT用例,现在都有大量垂直化的AI初创公司,致力于满足用户的需求,而不是满足于现有的ChatGPT界面和捆绑工具。

OpenAI的B2BB2C部分相互竞争,这在某种程度上是良性竞争。OpenAI可以使用来自ChatGPT的RLHF数据进行训练。而新的GPT商店可以看作是,OpenAI为了抓住这些垂直化需求的尝试。大部分创作者也很明智,一般只向ChatGPT发布精简版的应用,作为自己主要平台的一个渠道。

总的来说,Claude 3 Opus的成功超越GPT-4,标志着聊天机器人领域的新变化。而ChatGPT的未来发展,可能会以平台专属模型为特色,以此来抓住垂直化需求的机会。

原文和模型


【原文链接】 阅读原文 [ 1266字 | 6分钟 ]
【原文作者】 新智元
【摘要模型】 gpt-4-32k
【摘要评分】 ★★★★★

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...