王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

AIGC动态8小时前发布 QbitAI
55 0 0
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

 

文章摘要


【关 键 词】 Longcat模型美团AI技术设计应用实测业务布局

美团发布的开源大模型Longcat-Flash-Chat引发海内外技术圈热议。该模型成绩亮眼,在部分benchmark上表现超过DeepSeek-V3.1、Qwen3 MoE – 2507等,编程能力也值得关注,在TerminalBench上与Claude4 Sonnet不相上下。其技术报告还体现了美团对大模型的深入理解,有一系列新发现。

Longcat-Flash-Chat是560B的MoE模型,采用“零计算专家”与Shortcut – connected MoE双重设计。“零计算专家”通过动态激活参数、让前一块密集FFN与当前MoE通信阶段并行执行等方式,实现动态计算分配,提升训练与推理吞吐。Shortcut – connected MoE通过跨层快捷连接重排执行流水线,扩大计算 – 通信重叠窗口。规模化训练采用策略组合加速收敛,能力塑造经过多阶段训练,推理阶段实现多步重叠调度器提升吞吐。该模型在多类权威基准中处于第一梯队,与同级模型比较,实现了更高的单GPU吞吐和单用户速度,训练效率高、成本低。

实测中,Longcat在数学题解答上全部正确,解题过程合理。在绘制生物学光合作用卡尔文循环的SVG示意图任务中,能较顺利完成图示绘制。面对迷惑性问题,也能识破陷阱。

美团在大模型领域的布局并非偶然。2023年接手光年之外团队继续研发大模型,同年推出AI情感陪伴产品Wow。2024年王慧文回归领导GN06团队,该团队推出AI图像生成应用“妙刷”,美团明确“主动进攻”的AI策略,投入大量研发资金。Longcat大模型至少在2024年初就已可落地应用,结合外部模型为员工推出多种AI工具。2025年美团在AI方向动作更明显,推出AI编程应用NoCode等。美团的AI布局以业务场景驱动为核心,注重实际应用落地效果,早在大模型浪潮前就已明确将AI等作为未来核心方向。

原文和模型


【原文链接】 阅读原文 [ 2681字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...