标签：研究挑战

清华、上海AI Lab等顶级团队发布推理模型RL超全综述，探索通往超级智能之路

强化学习（RL）在人工智能发展中一直是重要方法，自1998年概念提出后，在多个领域取得显著成果。进入大模型时代，RL最初用于让模型更符合人类偏好，近年来研...

AIGC动态

6个月前

Ilya预言错了！华人Nature一作给RLHF「判死刑」，全球大模型都不可靠

剑桥大学等机构的研究人员在Nature上发表的论文中，对当前领先的大型语言模型（LLM）进行了全面评估，结果发现这些模型存在显著的不可靠性。研究团队对包括o1...

AIGC动态

1年前 (2024)

曝OpenAI超级对齐团队解散！

摘要：OpenAI的超级对齐团队最近发生了一系列重大变动。团队负责人伊利亚·苏茨克维和杨·莱克近期宣布辞职。莱克在社交媒体上表示，他离职是因为与公司高层对...

AIGC动态

2年前 (2024)