MiniMax，可能是今年最大的黑马。

623 0 0

文章摘要

MiniMax公司最新发布的M2语言模型在性能与成本效益方面展现出显著优势，引发行业关注。该模型在Artificial Analysis测试榜单中位列全球第五，总分低于GPT-5、Grok 4和Claude 4.5，但超越Claude 4.1版本。特别值得注意的是，M2在编码任务中成本仅为Claude 4.5 Sonnet的8%，同时保持80-90%的生成质量，且输出速度达到每秒85 Tokens，较Claude 4.5 Sonnet的61 Tokens有明显提升。

M2模型采用开源策略，当前位列Hugging Face趋势榜第四位，其核心方向聚焦于编程和智能体开发领域。配合模型发布，MiniMax同步推出限时14天的免费体验活动，涵盖模型API及新上线的Agent应用。实测显示，基于M2的Agent系统能够自主完成包含深度研究、设计规范制定、前后端开发及自动化测试在内的完整产品开发流程。在构建诗词网站的案例中，Agent耗时约两小时独立完成从数据收集到部署上线的全流程，期间展现出自动检查、错误修复和重复验证等专业开发行为。

技术实现方面，M2模型展现出对网页结构的深度理解能力，能够分析页面元素并进行交互测试。后端开发需依赖Supabase平台，但Agent可自主完成CMS系统的搭建。开发者体验中，模型表现出持续自主运行超过一小时的能力，包括23分钟不间断的自动化测试环节，这在一定程度上突破了当前AI代理产品的功能边界。

行业观察显示，MiniMax在多模态领域已取得音频模型全球第一、视频模型全球第二的成绩，结合此次语言模型的突破，该公司成为少数同时布局多模态和大语言模型的中国创业企业。虽然与顶尖模型仍存在差距，但M2凭借极致的成本优势，可能重塑编程辅助工具的市场格局。实际测试证实，该模型能够支持单人完成传统需团队协作的完整项目开发，预示着AI时代新型创作方式的到来。