标签:能力迁移

三星发力大模型!三星研究院联合北大发布 M2RL,系统揭秘多领域RL训练机制

三星研究院联合北京大学开展M2RL研究项目,系统对比混合多任务强化学习与专家模型融合两种后训练范式在构建通用大语言模型中的表现与机制。研究以Qwen3-4B-Ba...