[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-83011":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":16,"stars7d":17,"stars30d":17,"stars90d":15,"forks30d":15,"starsTrendScore":18,"compositeScore":19,"rankGlobal":10,"rankLanguage":10,"license":20,"archived":21,"fork":21,"defaultBranch":22,"hasWiki":23,"hasPages":23,"topics":24,"createdAt":10,"pushedAt":10,"updatedAt":25,"readmeContent":26,"aiSummary":27,"trendingCount":15,"starSnapshotCount":15,"syncStatus":14,"lastSyncTime":28,"discoverSource":29},83011,"awesome-agent-evolution","Shiyao-Huang\u002Fawesome-agent-evolution","Shiyao-Huang","Open survey and evidence map for AI agent evolution, self-evolving agents, memory, skills, harnesses, benchmarks, and agent-swarm systems.","https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002F",null,"JavaScript",179,7,2,0,1,43,3,2.71,"MIT License",false,"main",true,[],"2026-06-12 02:04:30","# Awesome Self-Evolving AI Agents\n\n**一份面向 AI Agent 自进化研究与实践的开放 Survey：连接论文、项目、benchmark、公开报告与 Evolve-AGI Index。**\n\n[中文主入口](README.md) | [英文版](README-EN.md) | [在线网站](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002F) | [论文 PDF](paper-drafts\u002Fmain.pdf) | [Evolve-AGI Index](analysis\u002Fevolve-agi-index.md) | [项目报告](projects\u002FINDEX.md)\n\n![Self Evolve 公开研究管线](site\u002Fpublic\u002Fvisuals\u002Fself-evolve-readme-banner.png)\n\n## 一句话\n\n想判断一个 AI Agent 是真的在自我改进，还是只是在演示里显得聪明？这份 Survey 给你一套可追溯的答案：看它改了什么、用什么反馈、谁来验证、能否迁移、如何回滚。\n\n## 三句话\n\n1. 我们把论文、开源项目、benchmark、博客\u002F社交信号和真实用户痛点放进同一条证据链，让读者先看判断，再查证据。\n2. 判断标准很简单：不要只看名字、stars 或 demo，要看它是否形成 Observe -> Interpret -> Modify -> Verify -> Retain 的闭环。\n3. [Evolve-AGI Index](analysis\u002Fevolve-agi-index.md) 已进入论文核心：它不是 AGI 能力分，而是衡量自进化智能体领域成熟度的证据指数。\n\n## 五句话\n\n1. 这不是普通 Awesome List，而是一份围绕“AI Agent 如何可靠地改进自己”的开放 Survey。\n2. 真正的自进化系统必须说明可变对象、反馈信号、更新算子、独立评估器、保留机制和回滚路径。\n3. 当前最清晰的机制骨架是五类进化回路：反思\u002F记忆、符号组件、验证驱动代码、架构搜索、课程\u002F权重\u002F种群演化。\n4. Evolve-AGI Index 把 benchmark 表现、闭环强度、证据可信度、迁移验证、可运行性、领域动量和治理成熟度放进同一个可审计指标，避免把热度误读成能力成熟。\n5. 读者可以从这里快速进入论文、项目 model card、公开报告、知识图谱和网站，而不是被几百个链接淹没。\n\n## 你可以直接用它做什么\n\n| 读者 | 你会得到什么 |\n|---|---|\n| 研究者 | 一套从分类、方法、系统、评估到未来路线图的 Survey 主线。 |\n| 工程师 | 判断一个 agent 项目是否具备可验证反馈、可审计记忆、评估框架和回滚能力。 |\n| 产品\u002F投资\u002F行业读者 | 区分真实能力积累、刷榜、演示热度和治理成熟度。 |\n| 内容创作者 | 获得带证据入口的选题地图：项目、论文、趋势、痛点、图谱和长尾 SEO 页面。 |\n\n## 本轮 GitHub Metadata 修复包\n\n| 仓库 | 这轮补了什么 | 为什么重要 |\n|---|---|---|\n| [pinchbench\u002Fskill](https:\u002F\u002Fgithub.com\u002Fpinchbench\u002Fskill) | 补了缺失的 `projects\u002F51-pinchbench-skill.md`、public report、deep report 和当前 raw snapshot。 | 它把 skill\u002Fharness\u002Fruntime 争论拉回真实任务 benchmark 与 transcript evidence。 |\n| [vectorize-io\u002Fagent-memory-benchmark](https:\u002F\u002Fgithub.com\u002Fvectorize-io\u002Fagent-memory-benchmark) | 刷新 stars\u002Fforks\u002Fissues\u002FPRs、README 方法论，并补进 deep report 与 site coverage。 | 它说明 memory 评测不能只看准确率，还要看 speed、token cost 和 agentic retrieval。 |\n| [EvoMap\u002Fawesome-agent-evolution](https:\u002F\u002Fgithub.com\u002FEvoMap\u002Fawesome-agent-evolution) | 新增外部 awesome-list comparator 卡片、deep report、site\u002Fpublic report。 | 它是我们 README\u002F网站分类叙事的外部镜子，尤其能校验 memory、benchmark、Agent-Swarm 的包装方式。 |\n\n```mermaid\nflowchart LR\n  RAW[\"原始证据\u003Cbr\u002F>GitHub \u002F 论文 \u002F 博客 \u002F 社交\"] --> PROC[\"加工证据\u003Cbr\u002F>分析 \u002F 研究 \u002F 项目\"]\n  PROC --> SURVEY[\"Survey 综合\u003Cbr\u002F>五类进化回路 + 痛点 + benchmark\"]\n  SURVEY --> SPARK[\"核心洞察\u003Cbr\u002F>受控自进化\"]\n  SPARK --> EAI[\"Evolve-AGI Index\u003Cbr\u002F>领域成熟度指数\"]\n  EAI --> PAPER[\"论文核心\u003Cbr\u002F>论点 + 贡献 + 路线图\"]\n  SURVEY --> SITE[\"网站 + 图谱 + 报告\"]\n```\n\n## 核心洞察\n\n一句话：本项目的核心洞察，是把 Self-Evolving AI Agents 从“自我改进的故事”变成“可审计的改进系统”。\n\n三句话：一个系统只有在反馈中改变自己的 prompt、memory、tool policy、workflow、code、weights 或 population，并且保留可验证证据时，才进入自进化范围。Survey 背后的全部资源现在按同一个问题重排：哪个对象在变，什么信号驱动它变，谁阻止它变坏。Evolve-AGI Index 是这次重排后的测量主线，它把论文发现、GitHub 语料、benchmark 和治理要求接成一条可复跑的数据流。\n\n五句话展开：\n\n1. 过去读者需要在链接、star 排名、论文列表和网站材料之间自行判断；现在先看到结论，再进入证据。\n2. Survey 不是“论文综述合集”，而是把论文、项目、benchmark、社交\u002F博客信号和用户痛点互相校验。\n3. 关键判断不再是“项目名字里有没有 evolution”，而是“系统是否形成 Observe -> Interpret -> Modify -> Verify -> Retain 的闭环”。\n4. Evolve-AGI Index 不只是网站模块，而是论文的核心贡献之一：给这个领域一个可解释的成熟度坐标系。\n5. 对外读者看到的每个核心判断都应该能回到论文、项目报告、数据索引或 benchmark 证据；没有证据链的结论标记为 `[UNVERIFIED]`。\n\n## 核心结论\n\n| 排名 | Survey 结论 | 对读者的意义 | 证据入口 |\n|---:|---|---|---|\n| 1 | 自进化是受控系统过程，不是 demo 标签。 | 读任何项目先问“改了什么、谁验证、怎么回滚”。 | [paper abstract](paper-drafts\u002Fmain.tex), [ch1 intro](paper-drafts\u002Fch1-intro.tex) |\n| 2 | Benchmark 是选择压力，也是风险源。 | 分数提高不等于能力积累；要看隐藏测试、迁移、成本、失败候选。 | [ch5 evaluation](paper-drafts\u002Fch5-evaluation.tex), [survey ch5](survey\u002Fch5-evaluation-cn.md) |\n| 3 | 记忆、技能、评估框架是核心基础设施。 | 不要只看模型层；可审计记忆、可安装技能和评估器才决定长期可用性。 | [ch7 painpoints](paper-drafts\u002Fch7-painpoints.tex), [agent-swarm evolve](analysis\u002Fagent-swarm-evolve.md) |\n| 4 | 五类进化回路比项目名更稳定。 | 新项目可以按机制归类，而不是被营销词牵着走。 | [survey methods](survey\u002Fch3-methods-cn.md), [method taxonomy](survey\u002Ffigures\u002Fmethod-taxonomy-mermaid.md) |\n| 5 | Evolve-AGI Index 应成为论文核心指标。 | 它把成熟度拆成 benchmark、闭环、证据、迁移、可运行、动量、治理七个信号。 | [Evolve-AGI Index](analysis\u002Fevolve-agi-index.md), [trend snapshot](reports\u002Fevolve-agi-index-trend.json) |\n| 6 | 用户真正关心信任边界。 | 产品价值来自可靠、透明、可控、低成本，不来自“更自主”的口号。 | [survey ch7](survey\u002Fch7-painpoints-cn.md), [site survey](site\u002Fsrc\u002Fpages\u002Fsurvey\u002Findex.astro) |\n| 7 | 失败候选和负结果是资产。 | 没有被拒补丁、回归记录和 lineage，无法判断系统是否真的会进化。 | [ch8 future](paper-drafts\u002Fch8-future.tex), [survey spark analysis](analysis\u002Fsurvey-resource-spark.md) |\n\n## Evolve-AGI Index 进入论文核心\n\n一句话：Evolve-AGI Index 是本 survey 的“领域成熟度仪表盘”，不是 AGI 终局能力评分。\n\n```text\nEAI = Σ(signal_score × signal_weight)\n```\n\n| 信号 | 权重 | 为什么进入核心 |\n|---|---:|---|\n| Benchmark 表现 | 18% | 自进化必须接受实测；但 benchmark 不能单独决定成熟度。 |\n| 闭环强度 | 20% | 没有可变对象、反馈、选择和保留机制，就没有自进化。 |\n| 证据链可信度 | 18% | 原始材料、分析、model card 和论文附录必须互相能追溯。 |\n| 迁移与验证 | 14% | 只在一个公开测试上涨分，不能证明能力积累。 |\n| 实现可获得性 | 12% | 能运行、能复用、能审计，才有工程价值。 |\n| 领域动量 | 10% | 新项目和社区动量是趋势信号，但不能覆盖证据质量。 |\n| 治理准备度 | 8% | 自修改系统必须有安全边界、日志、回滚和时间戳信心。 |\n\n当前快照来自 [reports\u002Fevolve-agi-index-trend.json](reports\u002Fevolve-agi-index-trend.json)：2026-06-01 的指数为 `72.9`，benchmark 子指数为 `80.1`，对应 `93` 个 strict evolution repos、`200` 个 broad evolution repos 和 `239` 个 trend 输入中的 analyzed public-report records。这个快照与 [docs\u002Findexes\u002Fmaster-index.md](docs\u002Findexes\u002Fmaster-index.md) 的全仓库计数共同使用；前者服务指数趋势，后者服务仓库治理和完整 public-report 文件口径。\n\n## Survey 证据地图\n\n| 层级 | 当前角色 | 关键证据 |\n|---|---|---|\n| 原始证据 | 保留 GitHub、论文、博客、社交素材，作为判断起点。 | [raw index](docs\u002Findexes\u002Fraw-index.md), `raw-github\u002F`, `raw-papers\u002F`, `raw-social\u002F`, `raw-blogs\u002F` |\n| 加工分析 | 把素材转成分类、机制、model card、paper review、ranking 和 Evolve-AGI Index。 | [processed index](docs\u002Findexes\u002Fprocessed-index.md), [GitHub analysis](analysis\u002Fgithub-project-data-analysis.md), [projects index](projects\u002FINDEX.md) |\n| Survey 论文 | 把机制、系统、评估、工业实践、痛点和未来方向写成论文结构。 | [survey CN chapters](survey\u002Fch1-intro-cn.md), [paper drafts](paper-drafts\u002Fmain.tex), [survey latex](survey\u002Flatex\u002Fmain.tex) |\n| 公开结果 | 发布 PDF、网站、报告、图谱、趋势快照和 SEO 页面。 | [results index](docs\u002Findexes\u002Fresults-index.md), [site](site\u002Fsrc\u002Fpages\u002Findex.astro), [reports](reports\u002F) |\n| 证据目录 | 给读者检查证据链、索引和公开结果的入口。 | [CONTENT_INDEX.md](CONTENT_INDEX.md), [master index](docs\u002Findexes\u002Fmaster-index.md) |\n\n```mermaid\nflowchart TB\n  Q[\"核心问题\u003Cbr\u002F>什么算真正自进化?\"] --> A[\"资源重组\u003Cbr\u002F>原始证据 -> 加工分析 -> Survey -> 公开结果\"]\n  A --> B[\"机制框架\u003Cbr\u002F>Five Evolution Loops\"]\n  A --> C[\"证据框架\u003Cbr\u002F>trust chain + model card\"]\n  A --> D[\"测量框架\u003Cbr\u002F>Evolve-AGI Index\"]\n  B --> P[\"论文核心\"]\n  C --> P\n  D --> P\n  P --> R[\"README \u002F 网站 \u002F PDF \u002F SEO\"]\n```\n\n## 论文主线\n\n| 章节 | Survey 成果 | 当前入口 |\n|---|---|---|\n| Ch1 Introduction | 定义 self-evolution，并把 Evolve-AGI Index 作为 evidence-to-index 贡献纳入核心。 | [paper-drafts\u002Fch1-intro.tex](paper-drafts\u002Fch1-intro.tex) |\n| Ch2 Taxonomy | 区分 continual learning、online learning、self-supervision、AutoML、RL 和真正 self-evolution。 | [paper-drafts\u002Fch2-taxonomy.tex](paper-drafts\u002Fch2-taxonomy.tex) |\n| Ch3 Methods | 按五类 loops 分析 feedback 如何变成 retained change。 | [paper-drafts\u002Fch3-methods.tex](paper-drafts\u002Fch3-methods.tex) |\n| Ch4 Systems | 比较 Self-Refine、Reflexion、ADAS、DGM、AlphaEvolve、Absolute Zero 等代表系统。 | [paper-drafts\u002Fch4-evolutionary.tex](paper-drafts\u002Fch4-evolutionary.tex) |\n| Ch5 Evaluation | 把 benchmark、trajectory、transfer、cost、regression 和 Goodhart 风险放在同一评估面。 | [paper-drafts\u002Fch5-evaluation.tex](paper-drafts\u002Fch5-evaluation.tex) |\n| Ch6 Frameworks | 讨论 runtime、memory、harness、workflow、tool sandbox 和 reference architecture。 | [paper-drafts\u002Fch6-frameworks.tex](paper-drafts\u002Fch6-frameworks.tex) |\n| Ch7 Pain Points | 用真实用户痛点校验研究问题：可靠性、成本、可观测性、权限、记忆污染。 | [paper-drafts\u002Fch7-painpoints.tex](paper-drafts\u002Fch7-painpoints.tex) |\n| Ch8 Future | 把 Evolve-AGI Index 扩展成 field knowledge data model 和后续路线图。 | [paper-drafts\u002Fch8-future.tex](paper-drafts\u002Fch8-future.tex) |\n\n## 怎么读这个仓库\n\n| 你想知道 | 先读 | 再读 |\n|---|---|---|\n| 这个领域一句话是什么 | 本 README 的 [核心洞察](#核心洞察) | [paper abstract](paper-drafts\u002Fmain.tex) |\n| 什么才算真正自进化 | [定义主题页](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Ftopics\u002Fself-evolving-ai-agents\u002F) | [definition criteria](analysis\u002Fself-evolution-definition-criteria.md), [ch1 intro](paper-drafts\u002Fch1-intro.tex) |\n| 自进化到底怎么发生 | [五类进化回路](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Ftopics\u002Ffive-evolution-loops\u002F) | [five-loop analysis](analysis\u002Ffive-evolution-loops-topic.md), [survey mechanisms](site\u002Fsrc\u002Fpages\u002Fsurvey\u002Fmechanisms.astro) |\n| 哪些系统真的会改代码 | [代码自我改进 Benchmark Matrix](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Ftopics\u002Fcode-evolution-benchmark\u002F) | [code benchmark matrix](analysis\u002Fcode-evolution-benchmark-matrix.md), [benchmark page](site\u002Fsrc\u002Fpages\u002Fbenchmark\u002Findex.astro) |\n| 什么项目真的算自进化 | [核心结论](#核心结论) | [projects\u002FINDEX.md](projects\u002FINDEX.md), [analysis\u002Fgithub-project-data-analysis.md](analysis\u002Fgithub-project-data-analysis.md) |\n| 哪些项目在 2026 年正在增长 | [公开增长数据库](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fstar-growth\u002F) | [GitHub star growth ranking](analysis\u002Fgithub-star-growth-ranking.md), [data-engine schema](data-engine\u002Fgithub-star-history\u002FREADME.md) |\n| 哪些素材最值得先深挖 | [Value LSH 价值分类图谱](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fvalue-lsh\u002F) | [value LSH index](analysis\u002Fvalue-lsh-index.md), [evidence repair queue](analysis\u002Fvalue-evidence-repair-queue.md) |\n| 论文现在怎么组织 | [论文主线](#论文主线) | [paper-drafts\u002Fmain.tex](paper-drafts\u002Fmain.tex), [survey\u002Flatex\u002Fmain.tex](survey\u002Flatex\u002Fmain.tex) |\n| 哪些图支撑 Survey\u002FPaper | [论文图谱页](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fpaper\u002F) 和 [可视化页](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fvisualizations\u002F) | [survey figures](survey\u002Ffigures\u002FREADME.md), [paper figure exporter](scripts\u002Fexport_survey_figures_for_paper.mjs), [paper figure assets](paper-drafts\u002Ffigures\u002F) |\n| Evolve-AGI Index 怎么进入核心 | [Evolve-AGI Index 进入论文核心](#evolve-agi-index-进入论文核心) | [analysis\u002Fevolve-agi-index.md](analysis\u002Fevolve-agi-index.md), [网站页面](site\u002Fsrc\u002Fpages\u002Fevolve-agi-index\u002Findex.astro) |\n| 全量文件在哪里 | [CONTENT_INDEX.md](CONTENT_INDEX.md) | [docs\u002Findexes\u002Fmaster-index.md](docs\u002Findexes\u002Fmaster-index.md) |\n| 网站和 SEO 在哪里 | [site](site\u002F) | [site survey page](site\u002Fsrc\u002Fpages\u002Fsurvey\u002Findex.astro), [graph page](site\u002Fsrc\u002Fpages\u002Fgraph\u002Findex.astro) |\n\n## 证据边界\n\n- [KNOWN] 全仓库治理计数来自 [docs\u002Findexes\u002Fmaster-index.md](docs\u002Findexes\u002Fmaster-index.md)，由 `node scripts\u002Fgenerate_project_indexes.mjs` 生成。\n- [KNOWN] GitHub 语料、strict\u002Fbroad evolution 子集和时间切片来自 [analysis\u002Fgithub-project-data-analysis.md](analysis\u002Fgithub-project-data-analysis.md) 与对应 JSON。\n- [KNOWN] GitHub star-growth 数据库来自 [data-engine\u002Fgithub-star-history\u002F](data-engine\u002Fgithub-star-history\u002F)、[analysis\u002Fgithub-star-growth-ranking.md](analysis\u002Fgithub-star-growth-ranking.md) 和公开页面 [star-growth](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fstar-growth\u002F)；累计 Star 只作为 adoption prior，正式 2026 增长排名必须要求 `complete_or_near_complete` 覆盖。\n- [KNOWN] Value LSH 分类图谱来自 [analysis\u002Fvalue-lsh-index.md](analysis\u002Fvalue-lsh-index.md)、[data-engine\u002Fvalue-lsh-index\u002F](data-engine\u002Fvalue-lsh-index\u002F) 和公开页面 [value-lsh](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fvalue-lsh\u002F)；它是深挖优先级和证据修复队列，不是最终价值判决。\n- [KNOWN] 资料库覆盖、计数口径和当前缺口来自 [analysis\u002Fresource-library-coverage-audit.md](analysis\u002Fresource-library-coverage-audit.md)；最新 raw\u002Fclassified\u002Fmodel-card\u002Fpublic-report 计数以 [docs\u002Findexes\u002Fmaster-index.md](docs\u002Findexes\u002Fmaster-index.md) 和 [analysis\u002Fgithub-project-data-analysis.md](analysis\u002Fgithub-project-data-analysis.md) 为准。\n- [KNOWN] Evolve-AGI Index 方法、权重和 benchmark 输入来自 [analysis\u002Fevolve-agi-index.md](analysis\u002Fevolve-agi-index.md)、[site\u002Fsrc\u002Fdata\u002FevolveAgiIndex.ts](site\u002Fsrc\u002Fdata\u002FevolveAgiIndex.ts) 和 [reports\u002Fevolve-agi-index-trend.json](reports\u002Fevolve-agi-index-trend.json)。\n- [KNOWN] Survey 章节和论文主稿来自 [paper-drafts\u002Fmain.tex](paper-drafts\u002Fmain.tex) 与 [survey\u002Flatex\u002Fmain.tex](survey\u002Flatex\u002Fmain.tex)。\n- [INFERRED] “核心洞察”是对上述证据的综合判断：把 Awesome 仓库升级为受控自进化领域的 Survey、指数和证据图谱，而不是一个单纯链接站。\n\n## 给读者的下一步\n\n| 目标 | 推荐入口 |\n|---|---|\n| 快速理解领域 | 先读本 README 的核心结论和 Evolve-AGI Index。 |\n| 深入阅读论文 | 打开 [paper-drafts\u002Fmain.pdf](paper-drafts\u002Fmain.pdf) 或 [paper page](site\u002Fsrc\u002Fpages\u002Fpaper\u002Findex.astro)。 |\n| 查项目证据 | 使用 [projects\u002FINDEX.md](projects\u002FINDEX.md) 和 [public project reports](site\u002Fpublic\u002Freports\u002Fprojects\u002FINDEX.md)。 |\n| 查数据范围 | 先看 [资料库覆盖页](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Fresource-library\u002F)，再查 [analysis\u002Fresource-library-coverage-audit.md](analysis\u002Fresource-library-coverage-audit.md)、[docs\u002Findexes\u002Fmaster-index.md](docs\u002Findexes\u002Fmaster-index.md) 和 [analysis\u002Fgithub-project-data-analysis.md](analysis\u002Fgithub-project-data-analysis.md)。 |\n| 按问题找主题 | 打开 [Survey\u002FSEO 主题地图](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Ftopics\u002F)，从定义、五类回路、[代码自改进](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002Ftopics\u002Fcode-evolution-benchmark\u002F)、Agent-Swarm、评估治理和生产痛点进入证据。 |\n| 浏览网站 | 打开 [Self Evolve site](https:\u002F\u002Fshiyao-huang.github.io\u002Fawesome-agent-evolution\u002F) 或本仓库的 [site source](site\u002F)。 |\n\n## Citation\n\n```bibtex\n@misc{awesomeSelfEvolvingAgents2026,\n  title        = {Awesome Self-Evolving AI Agents: Survey, Evidence Graph, and Evolve-AGI Index},\n  author       = {aha team},\n  year         = {2026},\n  howpublished = {\\url{https:\u002F\u002Fgithub.com\u002Fshiyao-huang\u002Fawesome-agent-evolution}},\n  note         = {Open survey repository for self-evolving AI agents, benchmark evidence, project model cards, and field maturity indexing.}\n}\n```\n","awesome-agent-evolution 是一个专注于 AI Agent 自进化研究与实践的开放性调查项目，旨在通过连接论文、项目、benchmark 和公开报告来评估 AI Agent 的自进化能力。该项目的核心功能包括提供一套可追溯的标准来判断 AI Agent 是否真正实现了自我改进，强调了从观察到验证再到保留的闭环过程，并引入了 Evolve-AGI Index 作为衡量领域成熟度的关键指标。技术上主要采用 JavaScript 实现。适用于研究者探索 AI Agent 进化机制、工程师评估具体项目的技术成熟度以及产品\u002F投资领域的决策支持等场景。","2026-06-11 04:09:53","CREATED_QUERY"]