标签:模型融合

Meta超级智能实验室又发论文,模型混一混,性能直接SOTA

大语言模型(LLM)的训练通常依赖大量算力和时间资源,而模型Souping(Model Souping)作为一种轻量级方法,通过对同一架构的多个模型进行权重平均,能够融合...

能精准解读X光片,开源视觉大模型Dragonfly

Together.ai最近开源了名为Dragonfly的大语言模型,该模型具有多分辨率视觉编码功能。Dragonfly设计了两个版本:Llama-3-8b-Dragonfly-v1和Llama-3-8b-Dragon...