autoresearch是Andrej Karpathy开源的项目,核心仅630行代码三个文件(prepare.py、train.py和program.md),能在单GPU上运行。该项目让AI Agent自主循环执行代码编辑、模型训练(固定5分钟时长)、评估(以val_bpb为统一指标)和迭代,全程无需人工干预,人类只需在program...
autoresearch是Andrej Karpathy开源的项目,核心仅630行代码三个文件(prepare.py、train.py和program.md),能在单GPU上运行。该项目让AI Agent自主循环执行代码编辑、模型训练(固定5分钟时长)、评估(以val_bpb为统一指标)和迭代,全程无需人工干预,人类只需在program.md文件中编写指令。
该项目已开源,训练代码来源于nanochat的简化版。 发布不到两天,GitHub星标超过9.5k,在X上获得580万次围观,未来目标包括模拟整个博士生研究社群。
还有多种改进版!只要你的目标明确,它会不断的深挖,不断的优化。