AI两天推翻20年工作习惯！Karpathy百行代码开源项目“封神”，AI替你通宵肝研究、战绩可查

57 0 0

文章摘要

特斯拉前AI总监Andrej Karpathy开源的autoresearch项目展示了AI Agent在深度学习研究中的自主能力：仅用630行Python代码构建了一个极简训练环境，其中Agent可自主修改train.py文件、执行5分钟训练、评估val_bpb指标（验证集每字节比特数），并依据结果决定保留或丢弃改动，形成闭环迭代。

整个系统设计强调可比性与轻量化——所有实验严格限定5分钟墙钟时间，确保不同配置下的结果可横向比较；核心文件仅有prepare.py（不可修改）、train.py（Agent唯一可编辑文件）与program.md（人类提供指令上下文）。

项目启动后，Agent在两天内完成276次实验，筛选出29项有效改进，使语言模型训练效率提升约11%，且所有优化可叠加并迁移至更大模型，实测将“训练至GPT-2水平耗时”从2.02小时降至1.80小时。

Karpathy指出，该过程全程零人工干预，彻底颠覆其20年来手动调优神经网络的常规工作流。

他强调，这并非模拟单个博士生，而是旨在构建由大量异步协作Agent组成的科研社群，以分布式方式贡献并累积研究分支。

当前社区已基于该项目搭建分布式协作层，实现多Agent共享成果与分工，累计运行近3000次实验，产生82项改进。

项目虽暂仅支持单GPU，但其设计哲学指向更广阔的未来：任何具备高效评估指标的任务（如小模型验证）均可交由Agent集群自主探索；人类角色将转向定义问题、提供初始上下文及在关键节点进行策略性介入。

Karpathy认为，当智能、注意力与韧性不再是瓶颈时，现有代码协作体系（如GitHub主干分支模型）将难以承载此类大规模异构研究产出。

目前该项目获36.9k Stars与1060万次围观，反映出学界与工业界对AI驱动科研范式转变的高度关注与积极跟进。