上海AI实验室FlowSearch刷新深度研究新纪录,结构化知识流大幅提升模型性能

AIGC动态3小时前发布 AIGCOPEN
40 0 0
上海AI实验室FlowSearch刷新深度研究新纪录,结构化知识流大幅提升模型性能

 

文章摘要


【关 键 词】 AI智能体动态知识流科研创新基准测试结构化框架

上海人工智能实验室开发的FlowSearch系统代表了AI智能体在深度研究领域的重要突破。该系统通过“动态结构化知识流”架构,成功克服了传统线性AI工作流在科研场景中的局限性。其核心创新在于采用有向无环图(DAG)组织研究过程,使AI能够模拟人类科学家的非线性思维模式。

该系统由三个关键组件构成协同工作机制。知识流规划器作为“研究组长”负责构建初始思维导图,将复杂问题分解为具有依赖关系的子任务节点;知识收集器作为执行单元,利用多工具组合完成具体研究任务;知识流优化器则持续重构知识图谱,根据新发现动态调整研究方向。这种架构实现了规划-执行-优化的闭环,使研究过程具备自我演进能力。

在性能验证方面,FlowSearch展现出显著优势。在GAIA基准测试中达到76.96%准确率,较基础模型o4-mini的独立性能提升近60个百分点;在GPQA-diamond子集的专业领域测试中,以87.37%的准确率超越GPT-5等主流模型;在更具挑战性的HLE多模态测试中,30.80%的准确率也领先于同类系统。特别值得注意的是,该系统在生物医药领域的TRQA测试中,作为通用智能体却超越了专业定制系统Origene近18个百分点。

这些成果验证了结构化工作流设计对提升AI科研能力的关键作用。实验数据表明,当o4-mini模型搭载FlowSearch框架后,其GAIA测试性能提升达452%,远超单纯扩大模型规模的效果。该系统通过模拟人类研究者的思维网络构建方式,实现了知识节点的动态关联与并行处理,有效解决了传统AI在复杂科研场景中存在的思维僵化、信息流失等问题。这种架构创新为AI在专业领域的深度应用提供了新的技术范式,特别是在需要多线程推理和动态调整的科研场景中展现出独特价值。

原文和模型


【原文链接】 阅读原文 [ 2216字 | 9分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...