标签：大推理模

清华、上海AI Lab等顶级团队发布推理模型RL超全综述，探索通往超级智能之路

强化学习（RL）在人工智能发展中一直是重要方法，自1998年概念提出后，在多个领域取得显著成果。进入大模型时代，RL最初用于让模型更符合人类偏好，近年来研...

AIGC动态

6个月前