标签:协作能力

中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026

现实世界中多智能体协作面临无法频繁试错的限制,离线强化学习成为重要方向。然而从单智能体转向多智能体时,系统需在反馈有限条件下学会协作,面临奖励稀疏...