Coding 之外，MiniMax 在悄悄做另一件事。

48 0 0

文章摘要

大模型在代码生成领域的优势并不能自然迁移至所有知识工作领域。金融场景因包含大量行业术语、财务口径及隐含判断，需要特定的领域经验参与训练。模型在编程任务上的优异表现，并不意味着其在金融等专业知识工作中具备同等能力。MiniMax M3通过引入具备金融背景的研究员参与模型训练与评估，在金融场景下展现出较高的初步可用性，其实际表现得益于行业工作方式和验证逻辑的深度融入。

通过统一环境下的横向对比测试，MiniMax M3、DeepSeek V4 Pro与GPT 5.5在三个真实投研场景中表现出不同特点。在财报数据整理与经营效率计算任务中，MiniMax M3能够精准识别不同公司的财务口径差异，在关键数据提取的准确度上优于其他对比模型。在分析核心持仓并生成研究报告的任务中，该模型主动搭建了逻辑递进的分析框架，交付成果最接近专业的证券研究报告。而在宏观产业链分析任务中，三款模型均展现出较高的完成度。MiniMax M3侧重于产业链结构与利润分配的深度拆解，DeepSeek V4 Pro擅长梳理关键模块与风险点，GPT 5.5则在核心公司与市场格局的经验表达上更具连贯性。

公开评测数据与实测结果相吻合，证实了MiniMax M3在金融评测中处于开源模型第一梯队。金融领域的知识工作不仅考验模型的推理能力，更要求其深度理解行业规则、统计口径与专业方法论。金融有望成为继代码生成之后，大模型竞争最为激烈的核心应用场景之一。随着大模型产品逐渐从程序员群体向研究员、分析师及运营等更广泛的知识工作者渗透，模型必须具备并持续深化对多元领域知识与工作方式的理解，从而满足复杂专业场景的实际业务需求。