最受欢迎开源大模型，为什么是通义？

AIGC动态2年前 (2024)发布 aitechtalk

3,992 0 0

文章摘要

开源大模型技术的发展正在改变人工智能领域的竞争格局。在过去一年中，通义千问的血缘模型数量迅速增长至5万多个，显示出开源模型在全球范围内的广泛影响力和应用潜力。开源模型的兴起，尤其是像llama、Mistral和Falcon这样的先锋，使得没有深厚AI背景的中小企业和个人开发者也能够以较低的成本训练和部署自己的专属模型。

在国内，开源大模型的发展也呈现出百家争鸣的局面，ChatGLM、Baichuan、DeepSeek和Qwen等国产模型引领了一波又一波的开源浪潮。通义千问的开源模型，作为国产开源的代表，已经展现出与全球顶尖开源模型相媲美的影响力。根据Hugging Face的数据，Qwen系列血缘模型的数量已经达到5万多个，这一数字仅次于Llama系列，成为衡量模型生态影响力的重要指标。

金沙江创投的朱啸虎曾公开表示，国内开源模型的性能已经不逊色于闭源模型，尤其是阿里的通义千问，许多创业公司都在使用其开源模型来训练自己的垂直领域模型。Qwen系列的衍生模型中，包括了面壁等明星大模型公司的微调模型，如基于SigLip-400M和Qwen2-7B进行微调的MiniCPM模型。

在2024年的云栖大会上，通义大模型推出了全新的开源系列Qwen2.5，其旗舰模型展现出了卓越的性能。Qwen2.5的发布，距离通义首次开源仅一年多的时间，这一成就的背后是阿里云在AI大模型时代的开源开放策略的支持。开源不仅推动了大模型的研发和应用，而且作为AI基础设施的云计算厂商，阿里云也成为了行业算力需求的重要承接方。

Qwen2.5系列模型具有两大特点：一是性能全球领先，稳居全球开源第一；二是开源模型数量史无前例，以满足开发者和中小企业的多样化需求。Qwen2.5系列包括了大语言模型、多模态模型、数学模型和代码模型，覆盖了从0.5B到110B的完整谱系。这些模型在多个权威测评集中的表现超越了同尺寸的开源模型，甚至在某些方面超越了更大参数规模的模型。

通义千问的开源策略还包括了与Hugging Face的合作，将模型代码合并到HuggingFace transformers代码库，以及与各类开源框架和工具的兼容支持。此外，通义团队还注重提升开发者体验，准备了多语种的模型文档，优化了文档质量，并提供了代码片段以帮助开发者快速部署和使用模型。

通义千问的开源模型Qwen的衍生模型数量已经超过5万，仅次于Llama，成为全球最大的开源社区Hugging Face中的佼佼者。通义千问的开源模型累计下载量已经突破4000万，显示出其在开发者和中小企业中的广泛受欢迎。此外，通义大模型还通过阿里云为30多万客户提供服务，覆盖了多个行业领域。

总的来说，通义大模型的开源之路是中国大模型追赶世界一线水平的缩影。开源在推动新技术发展和创新方面的价值和意义已经得到了验证，通义大模型在过去一年中极大地推动了中国大模型的生态繁荣。