“我们坚持开源！”阿里云发布“地表最强”中文大模型：半年一迭代、性能翻倍？

AIGC动态2年前 (2024)发布 ai-front

3,959 0 0

文章摘要

阿里云大模型生态在通义大模型发布一周年之际迎来了一次重大升级，主要包括四个方面的突破：首先，通义千问 2.5 版本正式发布，其模型性能全面超越 GPT-4 Turbo，成为目前最强的中文大模型；其次，Qwen1.5-110B 参数的开源模型在多个基准测评中取得最佳成绩，超越了 Llama-3-70B，成为开源领域最强的中文大模型；第三，ModelScope 魔搭成为中国最大的开源社区；最后，通义大模型通过阿里云服务的企业数量超过 9 万，成为最受中国企业欢迎的大模型。

阿里云还对通义大模型的品牌进行了升级，将“通义千问 APP”更名为“通义 APP”，集成了通义大模型的全栈能力，并免费为所有用户提供服务。通义 APP 集成了文生图、智能编码、文档解析、音视频理解、视觉生成等前沿能力，旨在成为每个人的全能 AI 助手。

在技术进步方面，通义千问 2.5 相比前一版本在理解能力、逻辑推理、指令遵循、代码能力上分别提升了 9%、16%、19%、10%。在权威基准 OpenCompass 上，通义千问 2.5 的得分追平了 GPT-4 Turbo，这是国产大模型首次在该基准上取得如此成绩。此外，通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越了 Gemini Ultra 和 GPT-4V，并已在多家企业中应用。

阿里云 CTO 周靖人强调了开源生态的重要性，并表示阿里云将坚持开源模式，开源最强的模型。阿里云在开源大模型方面的努力包括推出多款不同尺寸的模型，以适应不同的应用场景和设备需求。这些模型不仅在 Open LLM Leaderboard 上取得了优异成绩，还在实际应用中展现了其能力。

通义千问代码大模型 CodeQwen1.5-7B 是 HuggingFace 代码模型榜单 Big Code 的头名选手，具备优秀的代码生成和长序列建模能力。阿里还推出了通义灵码的企业版，以满足企业用户的定制化需求，并帮助提升研发效率。通义灵码掌握了多种编程语言，并在插件下载量和代码推荐方面取得了显著成绩。

通义大模型在多个行业中得到了广泛应用，包括 PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。多家企业，如小米、微博、众安保险、完美世界游戏等，已经宣布接入通义大模型，并将其应用于各自的业务领域。

阿里云还推出了百炼平台，这是一个提供一站式、全托管的大模型定制与应用服务的平台。开发者可以通过简单的操作快速开发大模型应用，并根据企业数据对大模型进行知识增强。百炼平台提供了丰富的模型和易用的工具箱，以满足企业和开发者的不同需求。

总的来说，通义大模型的发展不仅在技术性能上取得了显著进步，而且在品牌、生态、应用和服务方面都有了全面的提升。阿里云的 AI 之路展现出了强大的潜力和广阔的前景。