蚂蚁十天连发两个万亿参数大模型,获 LeCun 点赞

AI-Agent5小时前发布 Si-Planet
64 0 0
蚂蚁十天连发两个万亿参数大模型,获 LeCun 点赞

 

文章摘要


【关 键 词】 蚂蚁AI大模型开源生态AGI战略技术突破

蚂蚁集团在国庆期间密集发布了两款万亿参数大模型——Ling-1T和Ring-1T-preview,标志着国内万亿参数俱乐部扩容至三位成员。这两款模型基于自研Ling 2.0架构,采用超过20T高质量语料训练,在代码生成、数学推理等基准测试中超越GPT-5、Gemini-2.5-Pro等国际主流模型。其中,Ring-1T-preview作为纯自然语言推理模型,在CodeForces竞赛级任务中达到最高分,逼近GPT-5 with thinking水平。

百灵团队提出的”非共识”观点——Scaling Law尚未终结,通过Ling Scaling Law技术得到验证。该技术能自动计算最优参数配置,配合WSM调度器替代传统WSD策略,使模型在万亿规模下仍保持架构效率。模型采用稀疏激活设计,如Ling-1T每个token仅激活51B参数,结合Evo-CoT思维链技术,将能耗控制在百亿级水平。这种”大参数储备+小参数激活”模式,既突破能力上限又解决能耗痛点。

蚂蚁构建了完整的大模型家族体系:Ling系列为基础语言模型,Ring专注推理(类似GPT的O系列),Ming覆盖多模态。从10B到1T不同尺寸的mini/lite/1T版本形成能力金字塔,如16B的Ring-mini-2.0激活1.4B参数即可达到10B级推理能力,2.8B的Ming-lite-omni多模态性能比肩GPT-4o。HuggingFace上14个产品集合覆盖语言、多模态、具身智能等领域。

蚂蚁的AI战略明确以追求智能上限为核心,所有模型均采用”真开源”策略。CEO韩歆毅强调,虽然聚焦AI应用落地,但必须自研基础大模型以探索AGI边界。这种开源生态建设催生出Ling Scaling Law等范式级创新,同时通过百宝箱开发平台和InclusionAI社区推动技术共享。在应用层同步布局AI原生Agent,推出健康管家AQ、理财管家蚂小财等独立APP,探索多智能体协同的产品范式。

万亿模型的发布既是对智能上限的突破,也是蚂蚁AGI全景布局的关键落子。通过开源超大模型挖掘技术潜力,配合梯度化部署能力为应用层提供工具选择。这种”智能增长+场景落地”的双轨模式,既推动MoE架构等基础技术创新,又通过Agent产品验证商业化路径,最终形成从技术研发到生态建设的完整闭环。

原文和模型


【原文链接】 阅读原文 [ 2216字 | 9分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...