AI两天推翻20年工作习惯!Karpathy百行代码开源项目“封神”,AI替你通宵肝研究、战绩可查

AI-Agent1小时前发布 ai-front
57 0 0
AI两天推翻20年工作习惯!Karpathy百行代码开源项目“封神”,AI替你通宵肝研究、战绩可查

 

文章摘要


【关 键 词】 自主科研智能代理模型优化开源项目算力革命

特斯拉前AI总监Andrej Karpathy开源的autoresearch项目展示了AI Agent在深度学习研究中的自主能力:仅用630行Python代码构建了一个极简训练环境,其中Agent可自主修改train.py文件、执行5分钟训练、评估val_bpb指标(验证集每字节比特数),并依据结果决定保留或丢弃改动,形成闭环迭代。

整个系统设计强调可比性与轻量化——所有实验严格限定5分钟墙钟时间,确保不同配置下的结果可横向比较;核心文件仅有prepare.py(不可修改)、train.py(Agent唯一可编辑文件)与program.md(人类提供指令上下文)。

项目启动后,Agent在两天内完成276次实验,筛选出29项有效改进,使语言模型训练效率提升约11%,且所有优化可叠加并迁移至更大模型,实测将“训练至GPT-2水平耗时”从2.02小时降至1.80小时。

Karpathy指出,该过程全程零人工干预,彻底颠覆其20年来手动调优神经网络的常规工作流。

他强调,这并非模拟单个博士生,而是旨在构建由大量异步协作Agent组成的科研社群,以分布式方式贡献并累积研究分支

当前社区已基于该项目搭建分布式协作层,实现多Agent共享成果与分工,累计运行近3000次实验,产生82项改进。

项目虽暂仅支持单GPU,但其设计哲学指向更广阔的未来:任何具备高效评估指标的任务(如小模型验证)均可交由Agent集群自主探索;人类角色将转向定义问题、提供初始上下文及在关键节点进行策略性介入。

Karpathy认为,当智能、注意力与韧性不再是瓶颈时,现有代码协作体系(如GitHub主干分支模型)将难以承载此类大规模异构研究产出

目前该项目获36.9k Stars与1060万次围观,反映出学界与工业界对AI驱动科研范式转变的高度关注与积极跟进。


原文和模型


【原文链接】 阅读原文 [ 2274字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...