标签:多模态
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满
智源研究院近日发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解任务中表现出色,显著提升了多模态大模型对长视频内容的理解能力。Video-XL-2在M...
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
长视频理解作为多模态大模型的关键能力之一,尽管OpenAI GPT-4o和Google Gemini等私有模型已取得显著进展,但开源模型在效果、计算开销和运行效率等方面仍存...
代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
检索增强技术在代码及多模态场景中发挥着重要作用,而向量模型是这一技术体系中的核心组成部分。近日,智源研究院联合多所高校研发了三款向量模型,包括代码...
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满
智源研究院联合多所高校发布了三款向量模型,分别是BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索领域取得了显著成果,并在多个...
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA
智源研究院联合多所高校研发了三款向量模型,分别是代码向量模型BGE-Code-v1、多模态向量模型BGE-VL-v1.5和视觉化文档向量模型BGE-VL-Screenshot。这些模型在...
75万元奖金池+心动offer,启元实验室2025重磅赛事来袭,三大赛道,等你来战!
为推动智能算法从理论创新走向实际落地,启元实验室正式启动「启智杯」算法大赛。本届大赛聚焦「卫星遥感图像鲁棒实例分割」、「面向嵌入式平台的无人机对地...
大模型下半场,阶跃凭什么领跑多模态之战
国内大模型竞争格局已形成三大阵营:资源派、技术派和国家队。资源派以大厂为代表,凭借雄厚资本在基础模型和落地应用上持续投入;技术派以DeepSeek为代表,...
国产大模型「五强争霸」,决战AGI!
中国基础大模型市场近年来经历了显著变革,形成了以字节、阿里、阶跃星辰、智谱和DeepSeek为代表的“基模五强”格局。这五家企业凭借雄厚的资金、高密度的人才...
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力
多模态奖励模型(MRMs)在多模态大语言模型(MLLMs)的性能提升中扮演着关键角色,尤其在训练和评估阶段能够提供稳定的奖励信号。然而,尽管强化学习(RL)在...
KuaiMod来了!快手用大模型重构短视频生态格局
短视频已成为现代用户日常生活中不可或缺的一部分,不仅是娱乐方式,更是信息获取、观点表达和社交构建的主要媒介。随着短视频内容的爆炸式增长,平台面临着...




