文章摘要
【关 键 词】 推理能力、可验证AI、智能体系统、模型评测、科学家加盟
MiroMind发布MiroThinker-v1.7模型家族,标志着其在长链条任务智能体领域的重大升级。该系列支持256K上下文窗口与单任务最高300次工具调用,显著提升多步骤推理与决策准确性;提供30B与235B两种参数规模版本,兼顾不同算力场景需求。在多项权威基准测试中,MiroThinker-1.7取得突出成绩:BrowseComp-ZH达75.3%,GAIA-Val-165为82.7%,其中30B规模的Mini版本在中文浏览评测中亦以72.3%刷新开源模型纪录。专有智能体MiroThinker-H1表现更为优异,在BrowseComp、BrowseComp-ZH及GAIA等关键评测中分别达到88.2%、84.4%和88.5%,全面超越Claude-4.6-Opus、Gemini-3.1-Pro与GPT-5.4等当前顶级闭源模型。
技术路线核心聚焦“长链条可验证推理”,强调推理过程与结果均可被逐步或全局验证,以此增强复杂工作流的可靠性与可信度。MiroMind同步宣布三位顶尖科学家加盟,构建技术研发三大支柱:杜少雷博士任推理模型与训练首席科学家,负责端到端模型架构设计与大规模训练策略优化;安波教授主导运行时与智能体系统建设,目标是实现高度可靠、可水平扩展且完全可审计的执行框架;杨凯宇博士领导可验证AI实验室,专注可验证推理与生成方向,其过往在形式化证明系统(如LeanDojo、CoqGym)方面的成果为该方向奠定坚实基础。三位学者均具深厚学术积累与工业界经验,覆盖机器学习理论、多智能体系统及形式验证等关键领域。
公司创始人陈天桥提出“可发现智能”愿景,即AI不仅应分析已有知识,更需具备预测与探索新概念的能力。MiroMind致力于打造全球首个通用求解器——一种以推理优先、输出可被形式化证明的AI系统,旨在服务软件工程、金融服务、医疗制药等高风险领域。团队超80%为博士研究员,坚持不盲目追求参数规模扩张,转而深耕推理质量与系统可信性。此次开源MiroThinker-1.7,意在推动社区共同探索该技术路径,其在多语种信息检索与深度研究任务上的实证领先,已初步验证该差异化路线的有效性。
原文和模型
【原文链接】 阅读原文 [ 2115字 | 9分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★★★☆☆



