
PaperGuru-Benchmark
PaperGuru-AI
Lifecycle-Aware Memory for long-horizon LLM agents — 66.05% on PaperBench, 94.66% on SurveyBench, 10 peer-reviewed acceptances at FSE/ICML/TOSEM/AEI/ICoGB
AI 简介
PaperGuru-Benchmark 是一个针对长期记忆机制的基准测试项目,专为长周期大语言模型(LLM)代理设计。其核心功能在于提供了一种具有生命周期感知的记忆原语,通过单一算法机制在PaperBench和SurveyBench两个权威评测中取得了领先成绩,分别达到了66.05%和94.66%的表现,并且已经在FSE、ICML等顶级会议上有10篇同行评审论文被接受。该项目特别适用于需要长期记忆支持的研究场景,如学术研究中的文献综述生成与管理、复杂项目的持续跟踪分析等领域。
TeX
Other842
Stars
129
Forks
87
Watchers
0
Issues
Star 增长
今日0
近 7 天+61
近 30 天+541
综合评分80.34
默认分支main