AI 也有长久记忆了!谷歌Nested Learning让AI拥有持续学习的生命力

AIGC动态3小时前发布 AIGCOPEN
44 0 0
AI 也有长久记忆了!谷歌Nested Learning让AI拥有持续学习的生命力

 

文章摘要


【关 键 词】 AI大模型深度学习记忆系统优化算法持续学习

Google Research的科学家们针对AI大模型难以形成新长期记忆并避免灾难性遗忘的根本难题,提出了名为”Nested Learning”(嵌套学习)的突破性理论框架。这项已提交至NeurIPS 2025的研究指出,传统将模型架构与优化算法割裂的视角存在根本局限,而嵌套学习将其重新定义为统一、相互嵌套的系统。核心创新在于引入”更新频率”概念,模仿人脑多速率学习机制,使模型组件能按不同节奏更新,自然形成记忆层级结构。

研究团队通过三个关键技术将理论转化为实践:深度优化器(DMGD)用神经网络替代传统优化器,赋予其更强的历史梯度学习能力;自修改架构使模型能动态调整自身学习算法;连续记忆系统(CMS)打破传统记忆二元划分,构建由不同更新频率MLP块组成的记忆光谱。这些创新被整合为HOPE架构,其多层次动态知识存储系统在340M至1.3B参数规模的测试中,展现出更低的困惑度和更高的准确率,尤其在长上下文任务中表现出卓越的内存管理能力。

该研究最显著的突破在于重新定义了优化器的本质——它本身就是一个学习模块。这种视角转换使得梯度下降过程可被解构为嵌套结构:外层是慢速的模型参数学习,内层是快速的权重更新优化。就连Adam优化器中的动量项也被重新诠释为微型关联记忆模块。这种统一框架为构建持续学习AI奠定了新基础,使模型能像人类一样在不干扰核心知识的情况下吸收新信息。

实验数据验证了HOPE架构的优越性,其多速率记忆系统有效解决了灾难性遗忘问题。研究者特别指出,这种技术将革命性影响需要终身学习的领域,如机器人、自动驾驶等,使系统无需昂贵再训练即可持续进化。虽然当前研究尚未涉及类似人脑的离线记忆整理机制,但该成果无疑使通用人工智能向人类式的持续学习能力迈出了关键一步。

原文和模型


【原文链接】 阅读原文 [ 2083字 | 9分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...