MiniMax M3来了：编程超 GPT-5.5，即将开源

86 0 0

文章摘要

MiniMax近期发布了M3大语言模型，该模型在编程、百万上下文和原生多模态三个核心方向上均达到了国际前沿水平，并且即将开源。作为国内首个齐备图片与视频输入、计算机桌面操作等能力的模型，M3在多项权威评测中逼近甚至超越了海外顶级闭源模型，展现出强大的综合技术实力。

在编程与智能体能力方面，M3表现出卓越的自主执行与长程协作水平。在实战测试中，M3能够独立复现顶级学术会议获奖论文的核心实验，并在无参考代码的情况下自主完成高难度的底层硬件计算优化任务。此外，M3还能在无人干预的状态下自主完成数据合成、模型训练与评测迭代的全流程。在多项国际权威评测中，M3的得分均处于领先地位，其构建的交互式用户模拟器框架进一步提升了模型在真实研发场景中的长期协作与规划能力。

针对长上下文处理的计算瓶颈，M3从底层注意力机制入手，提出了全新的MSA稀疏注意力架构。该架构通过在注意力计算前进行初筛分块，避免了全局计算，使得在百万级上下文窗口下，每token的计算量大幅降低，预填充和解码阶段均实现了数倍以上的加速。这种硬件友好的设计不仅保障了大规模可用上下文，还让长上下文成为可持续扩展的维度，为复杂智能体任务提供了坚实的基础设施。

在多模态能力上，M3采用了原生多模态路线，从训练初期便将文本与视觉数据通过交错排列的方式混合输入，使不同模态的语义空间实现高度融合。这种原生设计使M3在文档理解等测试中表现优异，并原生支持计算机操作能力。配合M3发布的MiniMax Code也进行了全面升级，支持复杂任务拆解与跨系统自动操作。目前，M3的API已开放使用，提供不同上下文长度计费与双思考模式切换，模型权重及技术报告也即将在开源社区发布，以支持私有化部署与微调。