刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器

AI-Agent13小时前发布 almosthuman2014
93 0 0
刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器

 

文章摘要


【关 键 词】 模型开源昆仑万维Agent升级多模态AI成果落地

七月国产大模型开源成高频现象,各大厂商纷纷开源数十款模型,八月这一势头未减。昆仑万维在八月开启 Skywork AI 技术发布周,连续五天推出多个新模型,覆盖多模态 AI 核心赛道。

8 月 14 日,昆仑万维发布最新 Agent 成果,将天工超级智能体的核心引擎 Skywork Deep Research Agent 升级到 V2 版本。在权威搜索评测榜单 BrowseComp 和全球智能体基准测试集 GAIA 中,该版本均刷新 SOTA 成绩,超越众多竞品。

昆仑万维推出业界首个「多模态深度调研」Agent,解决了传统 Deep Research 功能忽视图片信息的痛点。它能识别处理图片信息,融入报告并生成图注和综合性图表,依靠四大核心技术突破,真正具备专业研究人员的感知与表达能力,且该功能已上线官网。

Skywork Deep Research Agent V2 的多模态深度浏览器智能体(Skywork Browser Agent)化解了传统浏览器智能体的诸多瓶颈。它能高效分析社交媒体多模态信息,生成可视化报告和独立网站,还支持二次编辑,其高效稳定得益于多项自研关键技术方案,不过目前尚处内测和邀测阶段,预计下周全量开放。

昆仑万维 Agent 产品表现出色,依托 Skywork Deep Research Agent V2 的多项关键提升机制。在数据层面,自研端到端深度信息问题合成流程,为强化学习提供数据基础;算法上,提出非对称验证驱动的强化学习方法,引入基于线索的生成式密集奖励机制;算力方面,自研并行推理框架,提升推理效率并节省资源;还构建多智能体演进系统,强化任务应对和环境适应能力。

2025 年过半,AI 行业重心向成果开源与应用落地转移。昆仑万维的模型发布是其 AI 技术成果展示和多模态 AI 领域加速落地的信号。其全栈式布局彰显发展决心,深度研究 Agent 有望拓宽大模型落地边界,为 AI 行业带来高效智能解决方案。

原文和模型


【原文链接】 阅读原文 [ 5442字 | 22分钟 ]
【原文作者】 机器之心
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...