两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?

AIGC动态5个月前发布 ai-front
950 0 0
两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?

 

文章摘要


【关 键 词】 AI模型代码生成多语言支持推理能力性能优化

法国AI初创公司Mistral发布了其旗舰级开源模型Mistral Large 2,拥有1230亿个参数,与Meta和OpenAI的最新模型在代码生成、数学和推理方面表现相当。Mistral Large 2在一些基准测试中展现了性能和成本优势。该模型仅授权非商业研究用途,商业应用需付费许可。

Mistral Large 2的上下文窗口增至12.8万个token,支持数十种新语言,包括葡萄牙语、阿拉伯语、印地语等。该模型适合需要强大推理能力或高度专业化任务的场景,如合成文本生成、代码生成等。

Mistral Large 2在训练过程中重点关注减少模型幻觉问题,使其能更敏锐地意识到自己不知道的事情,避免编造看似合理的事情。此外,该模型的响应比领先AI模型更简洁。

在编码能力方面,Mistral Large 2经过大量代码训练,表现优于初版Large模型,与GPT-4o、Claude 3 Opus和Llama 3 405B相当。在推理能力方面,Mistral通过微调模型,减少了产生幻觉的倾向,提高了准确性。

Mistral Large 2在多语言MMLU基准测试中与Meta的Llama 3.1-405B相当,支持80多种编码语言。该模型专为单节点推理设计,适合长上下文类应用场景。

在指令遵循与对齐方面,Mistral Large 2经过微调,能更好地遵循用户指引,处理长时间多轮对话。新模型还经过调优,使答案保持简洁明了。

Mistral已通过API商战平台和云平台开放Mistral Large 2模型访问。在多方面对比中,Mistral Large 2在代码能力和数学基础测试中优于Llama 3.1 405B,在语言多样性方面略逊于Llama 3.1 405B,在推理和指令遵循与对齐方面与Llama 3.1 405B不相上下。

Mistral表示,Mistral Large 2将继续突破成本效率、速度与性能的极限,为用户提供更多新功能。网友对Mistral Large 2的发布表示肯定,认为其在减少幻觉和模型规模方面取得了重要进步。同时,也有网友指出,最好的模型都在向GPT-4类能力靠拢,同时在速度和价格上展开竞争,变得更小、更快、更简洁。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2409字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...