文章摘要
【关 键 词】 AI模型、开源技术、智能代理、编程能力、性能优化
MiniMax作为中国AI独角兽企业,近期发布了专为智能体和代码任务设计的新一代模型M2,在开源领域刷新了多项性能纪录。M2以Claude Sonnet 8%的价格实现了近两倍的推理速度,展现出显著的性价比优势。这家成立仅三年的公司已完成多轮融资,2023年6月获得超2.5亿美元投资,其前代产品MiniMax-M1系列曾超越DeepSeek-R1等知名开放权重模型。
M2采用混合专家(MoE)架构,总参数量达2300亿,但每次推理仅激活约100亿参数,实现了性能与成本的优化平衡。该模型特别强化了智能代理所需的三大核心能力:编程、工具使用和深度搜索。在编程方面虽略逊于国际顶级模型,但已位居中国市场领先地位;在工具调用和复杂任务规划方面则接近国际先进水平。模型专为端到端开发工作流设计,能协调调用Shell、浏览器、Python解释器等多样化工具。
性能测试显示,M2在Artificial Analysis的10项基准测试中位列全球前五,并在编程与智能代理相关测试中刷新开源模型纪录。其API定价为输入令牌0.3美元/百万、输出令牌1.2美元/百万,配合约100 TPS的推理速度,形成了极具竞争力的技术方案。MiniMax通过构建价格-性能、价格-速度的双维评估体系,证实M2在”不可能三角”中取得了突破性进展。
部署方面,M2模型权重已在Hugging Face开源,推荐使用vLLM或SGLang框架部署。前者具备PagedAttention等高效内存管理功能,后者则通过RadixAttention前缀缓存实现低延迟服务。公司同步推出了限时免费的MiniMax Agent产品,包含闪电模式(适合即时任务)和专业模式(处理复杂长周期任务),并开放API接口供开发者调用。
MiniMax始终贯彻”普惠智能”理念,其内部已形成AI原生工作模式。从技术研究、日常编程到人力资源筛选,各类智能代理深度参与企业运营。这种从开发AGI到与AGI协同进化的实践路径,不仅验证了M2的实际应用价值,也为AI技术落地提供了可复用的方法论。当前技术演进表明,能够平衡性能、成本与速度的解决方案,正推动AI向更广泛的实用化场景渗透。
原文和模型
【原文链接】 阅读原文 [ 1922字 | 8分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆




