Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

AIGC动态4个月前发布 QbitAI
276 0 0
Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

 

文章摘要


【关 键 词】 AI模型竞技场性价比开发者项目

在大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首,超过了GPT-4。小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。Haiku的输入token价格比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。

Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成为开发者新宠,其速度、功能和上下文长度在目前的市场上是独一份的。已经有人第一时间大开脑洞,搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目,吸引不少关注。这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。还有人用OpusHaiku搞了个“AI股票分析师”,直接火上了GitHub热榜。不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel

然而,就在一片给Claude 3新王点赞的声音中,也有网友认为:GPT-3.5作为一个“老”模型,至今仍在与最新的模型竞争,这件事本身就很疯狂了。但最让开发者们期待的当然还是:OpenAI,快起来卷(doge)。

原文和模型


【原文链接】 阅读原文 [ 606字 | 3分钟 ]
【原文作者】 量子位
【摘要模型】 gpt-4-32k
【摘要评分】 ★★★★☆

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...