标签:长尾延迟

月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面联合清华大学提出的全新加速引擎Seer,通过创新技术显著提升大语言模型(LLM)的强化学习训练效率。该系统针对传统RL训练中生成阶段(rollout phase...