Meta超智能体开源：任意可计算任务中，能自我改进实现无尽演化

65 0 0

文章摘要

DGM-Hyperagents（DGM-H）提出了一种突破性架构，使AI系统首次实现对自身改进机制的动态优化。该系统将任务执行模块与元智能体整合于同一可编辑程序中，支持任务智能体和元智能体相互修改，形成闭环的自指结构，从而绕开传统多层级递归导致的无限倒退问题。研究团队通过四类实证任务验证其有效性：在编程任务中，准确率由14.0%提升至34.0%；论文评审测试集准确率从0升至71.0%，显著优于现有开源基线；机器人奖励函数设计任务中，测试得分达37.2%，超过默认方法；关键消融实验表明，若移除自我改进能力或开放式探索机制，系统性能几乎无法提升，凸显两个核心组件缺一不可。元认知自我修改与开放式探索是支撑DGM-H性能跃升的基础架构。

最突出的是DGM-H展现出的跨领域迁移能力。通过“improvement@k”指标评估发现，DGM-H在论文评审和机器人任务上优化出的智能体，能在全新奥数评分任务中实现0.630的改进度@50，而传统DGM则完全无迁移效应。其迁移优势源于系统自主衍生出通用性元级能力，如性能追踪与持久记忆机制——前者用于识别有效改进路径，后者支持见解沉淀与历史调用，显著降低重复试错成本。相较之下，原始DGM的改进策略依赖人工定制规则，不具备泛化潜力。

安全性成为技术演进中的重要议题。研究者采用沙箱环境隔离运行代码、设定资源限制及人类监督机制，在可控条件下推进实验；但团队同时明确指出，随着自我进化速度加剧，现有安全措施可能面临极限挑战。研究者主动在论文中展开关于透明度、可控性与价值导向的伦理讨论，呼吁建立适应新范式的监管框架。当前版本仍存局限，如任务分布固定、父代选择机制等外层流程未被智能体介入；不过已有初步证据证明让智能体参与这类高级调度是可行路径。

DGM-H的提出标志着开放式自我改进机制从理论走向多领域实践，为构建真正具备持续学习与越级演化的AI系统提供雏形支撑，其核心价值在于不再局限于任务结果优化，而是转向“如何更聪明地寻找解决方案”的根本性升级。这项工作预示着AI发展正迈向以自演化为核心特征的新阶段。