标签:模型融合

三星发力大模型!三星研究院联合北大发布 M2RL,系统揭秘多领域RL训练机制

三星研究院联合北京大学开展M2RL研究项目,系统对比混合多任务强化学习与专家模型融合两种后训练范式在构建通用大语言模型中的表现与机制。研究以Qwen3-4B-Ba...

Meta超级智能实验室又发论文,模型混一混,性能直接SOTA

大语言模型(LLM)的训练通常依赖大量算力和时间资源,而模型Souping(Model Souping)作为一种轻量级方法,通过对同一架构的多个模型进行权重平均,能够融合...

能精准解读X光片,开源视觉大模型Dragonfly

Together.ai最近开源了名为Dragonfly的大语言模型,该模型具有多分辨率视觉编码功能。Dragonfly设计了两个版本:Llama-3-8b-Dragonfly-v1和Llama-3-8b-Dragon...