开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

AIGC动态2年前 (2024)发布 QbitAI

3,158 0 0

文章摘要

【关键词】 开源大模型、Qwen1.5-110B、性能提升、社区响应、多语言支持

Qwen1.5-110B模型开源：国内通义千问开源了一款千亿级参数模型Qwen1.5-110B，该模型在多个基准测试中超越了Llama 3 70B，成为最强的开源大模型。

性能提升：Qwen1.5-110B相较于之前的720亿参数模型在性能上有明显提升，尤其在中文能力方面，优势更为明显。

社区响应：模型开源后，社区热烈响应，Ollama平台迅速上线，帮助用户在本地环境运行大语言模型。

尺度定律（Scaling Laws）：文章提到了尺度定律在Llama 3和Qwen1.5-110B中的应用，强调了模型规模增加带来的性能提升，以及在模型大小扩展方面仍有很大的提升空间。

长文本和多语言能力：Qwen1.5-110B在长文本处理和多语言支持方面表现出色，支持包括中文、英文在内的多种语言，并且在12个较大的语言中表现不逊于GPT-3.5。

型号丰富度：开源模型的型号丰富度为用户提供了更多选择，尤其是在大模型应用向端侧转移的背景下。

阿里的开源策略：文章提到了阿里巴巴在开源大模型方面的积极态度，强调了其“把开源进行到底”的策略，并分析了其背后的技术层面和战略层面的考量。

开源与闭源模型的竞争：尽管闭源模型如GPT系列和Claude系列目前占据领先地位，但开源模型正不断取得新进展，形成激烈的竞争态势。

文章通过对比Qwen1.5-110B和Llama 3模型，展示了开源大模型在性能、中文处理能力、长文本处理和多语言支持方面的优势，同时强调了开源社区对于这些模型的积极响应和支持。此外，文章还探讨了开源大模型的发展趋势，以及阿里巴巴在推动开源大模型发展方面的策略和动机。

原文和模型

【原文链接】 阅读原文 [ 3174字 | 13分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # GPT-GPTs # 大模型 # Qwen1.5-110B # 多语言支持 # 开源大模型 # 性能提升 # 社区响应

文章版权归作者所有，未经允许请勿转载。

OpenAI甩王炸！发布新模型o3，一夜再次改变世界！

AIGC开放社区

3,246

英伟达 RTX 5090、5080 和 5070 Ti 最新基测：不支持 DLSS 的游戏将拥有更多 AI 能力

AI前线

2,736

苹果发布高效双EMA梯度优化方法，适配Transformer、Mamba模型

AIGC开放社区

2,782

FlashAttention-4正式发布：算法流水线大改，矩阵乘法级速度

机器之心

276

刚刚，GPT-4.5震撼上线情商逆天！OpenAI最大最贵模型最像人类，奥特曼带娃缺席

新智元

2,205

时隔6年，谷歌BERT终于有替代品了！更快更准更长，还不炒作GenAI

机器之心

2,406

暂无评论

暂无评论...

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

文章摘要

原文和模型

不如英伟达？Mobileye直面质疑

具身智能占领中国硅谷？1.23万AI学者集结海淀，填补全球百亿人形机器人空缺

相关文章

暂无评论

热门网址

热门文章

开源大模型王座再易主，通义千问1100亿参数拿下SOTA，3个月已推出8款模型

文章摘要

原文和模型

不如英伟达？Mobileye直面质疑

具身智能占领中国硅谷？1.23万AI学者集结海淀，填补全球百亿人形机器人空缺

相关文章

暂无评论

Trac-AI IDE

星辰Agent

讯飞文书-办公助手

热门网址

热门文章