智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

AIGC动态2天前发布 QbitAI
57 0 0
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

 

文章摘要


【关 键 词】 向量模型检索增强多模态代码优化视觉化

智源研究院联合多所高校研发了三款向量模型,分别是代码向量模型BGE-Code-v1、多模态向量模型BGE-VL-v1.5和视觉化文档向量模型BGE-VL-Screenshot。这些模型在代码及多模态检索领域取得了显著成果,并在多个主要测试基准中登顶。BGE系列模型自2023年8月发布以来,已成为中国首个登顶Hugging Face榜首的国产AI模型,并成为2023年度全球下载冠军。目前,这三款模型已向社区全面开放,为相关技术研究与产业应用提供支持。

BGE-Code-v1是基于Qwen2.5-Coder-1.5B打造的代码向量模型,专为代码检索任务设计,具备强大的多语言文本理解能力。该模型在CoIR和CodeRAG-Bench基准测试中均以显著优势超越其他商业和开源模型,成为代码-文本检索任务的最优选择。BGE-Code-v1适用于开发文档搜索、代码库语义检索、跨语言信息获取等多种实际应用场景。

BGE-VL-v1.5是基于LLaVA-1.6训练的通用多模态检索模型,全面升级了图文理解能力。该模型在MegaPairs数据基础上进行了多任务训练,显著提升了泛化性与理解能力,适用于图文匹配、多模态问答、跨模态推荐等场景。在MMEB基准测试中,BGE-VL-v1.5刷新了zero-shot模型的最佳表现,并在检索任务上登顶SOTA。

BGE-VL-Screenshot是基于Qwen2.5-VL-3B-Instruct的视觉化文档向量模型,专注于复杂多模态任务中的视觉信息检索。该模型在MVRB基准测试中以60.61的综合得分达到SOTA,并在多语言任务上表现出色。BGE-VL-Screenshot适用于网页、文档等多模态任务,能够从复杂结构中提取关键信息并精准理解文本与视觉语义。

智源研究院将继续深耕向量模型与检索增强技术,进一步提升BGE模型系列的能力与通用性。未来,研究院期待与更多科研机构与产业伙伴合作,共同推动检索与人工智能的发展。BGE系列模型的开放与广泛应用,将为构建更强大的多模态检索增强系统提供有力支持。

原文和模型


【原文链接】 阅读原文 [ 1674字 | 7分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...