一口气发 100 个开源模型、主力模型再大降价！阿里：不然谈什么应用爆发？！

AIGC动态2年前 (2024)发布 ai-front

3,849 0 0

文章摘要

在最近的云栖大会上，阿里巴巴展示了其在人工智能领域的最新进展，特别是通过发布新一代开源模型Qwen2.5，以及对现有模型进行大幅降价，进一步推动了大模型技术的普及和应用。Qwen2.5系列包括100多个模型，覆盖了大语言模型、多模态模型、数学模型和代码模型等多个领域，每个模型都有基础版、指令跟随版和量化版，以满足不同业务场景的需求。

阿里云CTO周靖人在会上强调，这些模型的发布并不是为了竞争，而是为了给开发者提供更多的选择，让他们能够根据自己的业务需求进行模型能力增强和推理效率的优化。Qwen2.5系列在语言模型方面开源了7个不同尺寸的模型，包括0.5B、1.5B、3B、7B、14B、32B和72B，其中72B模型在多个核心任务的测评中表现优异，参数量不到Llama3.1-405B的1/5。

除了语言模型，阿里还开源了编程和数学领域的专项模型，以及视觉语言模型Qwen2-VL-72B，该模型能够识别不同分辨率和长宽比的图片，理解长视频，并具备操作手机和机器人的视觉智能体能力。截至2024年9月中旬，通义千问开源模型的下载量已超过4000万，Qwen系列衍生模型总数超过5万个，成为仅次于Llama的世界级模型群。

在大模型开源领域，Llama系列模型的下载量接近3.5亿次，显示出开源模型的强大吸引力。与此同时，其他如OpenAI的GPT系列、Anthropic的Claude大模型、百度的文心大模型、华为的盘古大模型等则选择了闭源，这反映了行业内对大模型发展路径的不同看法。

为了降低企业使用模型的成本，阿里云在大会上宣布了通义千问三款主力模型的价格再次下调，Qwen-Turbo价格直降85%，Qwen-Plus和Qwen-Max分别降价80%和50%。周靖人表示，通过技术的优化，包括模型迭代、模型推理架构、系统优化和云基础设施的提升，可以进一步降低模型的整体成本，从而推动AI技术的广泛应用。

此外，阿里云还在大会上展示了其AI驱动的全系列产品家族升级，包括磐久AI服务器、ACS GPU容器算力、HPN7.0高性能网络架构、CPFS文件存储和PAI人工智能平台，这些都是为了提供更高性能、高效的算力服务，以支持AI和应用的发展。

总的来说，阿里巴巴通过开源模型的发布和价格的下调，正在积极推动AI技术的普及和应用，同时也在通过技术创新来降低AI基础设施的成本，以期在未来实现更广泛的AI应用爆发。