标签:大推理模

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

强化学习(RL)在人工智能发展中一直是重要方法,自1998年概念提出后,在多个领域取得显著成果。进入大模型时代,RL最初用于让模型更符合人类偏好,近年来研...