标签:研究挑战

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

强化学习(RL)在人工智能发展中一直是重要方法,自1998年概念提出后,在多个领域取得显著成果。进入大模型时代,RL最初用于让模型更符合人类偏好,近年来研...

Ilya预言错了!华人Nature一作给RLHF「判死刑」,全球大模型都不可靠

剑桥大学等机构的研究人员在Nature上发表的论文中,对当前领先的大型语言模型(LLM)进行了全面评估,结果发现这些模型存在显著的不可靠性。研究团队对包括o1...

曝OpenAI超级对齐团队解散!

摘要:OpenAI的超级对齐团队最近发生了一系列重大变动。团队负责人伊利亚·苏茨克维和杨·莱克近期宣布辞职。莱克在社交媒体上表示,他离职是因为与公司高层对...