标签：RL

MiniMax 技术闭门会分享：长上下文是 Agent 的 Game Changer

MiniMax在7月10日举办的M1技术研讨会汇集了全球顶尖的研究者和业界嘉宾，深入探讨了模型架构创新、RL训练、长上下文应用等前沿话题。RL能否赋予模型新能力？...

AI-Agent

8个月前

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

强化学习（RL）与大型语言模型（LLM）的结合在2025年展现了巨大的潜力，尤其是在后训练时代。RL通过其在策略优化和创造力方面的优势，证明了其与LLM的互补性...

AI-Agent

11个月前

强化学习之于 AI Agent，是灵魂、还是包袱？

自主决策能力被视为AI时代“新基建”的核心，而Workflow技术似乎无法实现真正的通用Agent。AlphaGo的问世标志着AI首次展示出非模板化、非规则驱动的智能行为，...

AI-Agent

11个月前