MiroMind新模型超越GPT-5.4，三位顶尖AI科学家加盟

44 0 0

文章摘要

MiroMind发布MiroThinker-v1.7模型家族，标志着其在长链条任务智能体领域的重大升级。该系列支持256K上下文窗口与单任务最高300次工具调用，显著提升多步骤推理与决策准确性；提供30B与235B两种参数规模版本，兼顾不同算力场景需求。在多项权威基准测试中，MiroThinker-1.7取得突出成绩：BrowseComp-ZH达75.3%，GAIA-Val-165为82.7%，其中30B规模的Mini版本在中文浏览评测中亦以72.3%刷新开源模型纪录。专有智能体MiroThinker-H1表现更为优异，在BrowseComp、BrowseComp-ZH及GAIA等关键评测中分别达到88.2%、84.4%和88.5%，全面超越Claude-4.6-Opus、Gemini-3.1-Pro与GPT-5.4等当前顶级闭源模型。

技术路线核心聚焦“长链条可验证推理”，强调推理过程与结果均可被逐步或全局验证，以此增强复杂工作流的可靠性与可信度。MiroMind同步宣布三位顶尖科学家加盟，构建技术研发三大支柱：杜少雷博士任推理模型与训练首席科学家，负责端到端模型架构设计与大规模训练策略优化；安波教授主导运行时与智能体系统建设，目标是实现高度可靠、可水平扩展且完全可审计的执行框架；杨凯宇博士领导可验证AI实验室，专注可验证推理与生成方向，其过往在形式化证明系统（如LeanDojo、CoqGym）方面的成果为该方向奠定坚实基础。三位学者均具深厚学术积累与工业界经验，覆盖机器学习理论、多智能体系统及形式验证等关键领域。

公司创始人陈天桥提出“可发现智能”愿景，即AI不仅应分析已有知识，更需具备预测与探索新概念的能力。MiroMind致力于打造全球首个通用求解器——一种以推理优先、输出可被形式化证明的AI系统，旨在服务软件工程、金融服务、医疗制药等高风险领域。团队超80%为博士研究员，坚持不盲目追求参数规模扩张，转而深耕推理质量与系统可信性。此次开源MiroThinker-1.7，意在推动社区共同探索该技术路径，其在多语种信息检索与深度研究任务上的实证领先，已初步验证该差异化路线的有效性。