美团新模型有点东西:像调度外卖小哥一样优化大模型

AIGC动态20小时前发布 Si-Planet
102 0 0
美团新模型有点东西:像调度外卖小哥一样优化大模型

 

文章摘要


【关 键 词】 美团模型算力调度技术创新性能测试价格杠杆

美团将外卖“派单逻辑”应用于AI世界,推出LongCat – Flash模型,精准调度算力,试图在大模型赛道开辟新战场。

技术创新方面,LongCat – Flash的特别之处在于“精打细算”。其总参数规模达5600亿,但实际推理时每个token仅调用约18.6B – 31.3B,如同根据订单难度派出合适骑手,避免算力浪费。“零计算专家”可对简单token直接放行,实现“按需分配”。ScMoE创新机制让算力使用和通信同时进行,提升整体效率。

工程能力方面,LongCat – Flash采用逐步扩张的训练方式,先小范围试运行,再推广到更大范围。它设置“三重保障”,包括Router稳定、激活稳定和优化器稳定,确保系统稳定运行,30天完成20万亿tokens的训练任务。

性能比较方面,LongCat – Flash在各大基准测试中表现稳健。在通用任务、复杂推理、数学能力和编程任务等测试中,与国际一线模型相当,部分略低于Kimi – K2,但优于多数基线模型。

实测方面,美团LongCat – Flash速度极快。在相同提示词下,相比kimi 1.5,它能迅速输出内容,且核心代码质量相当,可谓又快又好。

虽然LongCat – Flash的速度和价格优势未必能立刻改写行业格局,因为大模型市场中生态和用户习惯更具粘性,但它透露出美团用“调度骑手”逻辑解决复杂科技问题,以价格杠杆撬开市场的信号。美团看似“接地气”的切入点,可能成为搅动格局的变量,如同曾经的DeepSeek。十年前美团靠补贴打造外卖帝国,如今它已递出大模型赛道的第一张筹码,未来能否靠价格战进入大模型牌桌,值得关注。

原文和模型


【原文链接】 阅读原文 [ 1667字 | 7分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...