
LongMemEval-V2
xiaowu0162
Official repository for LongMemEval-V2
AI 简介
LongMemEval-V2 是一个用于评估长期记忆系统在定制环境中帮助代理获得成为有经验同事所需知识能力的基准。该项目核心功能包括对五种记忆能力(静态状态回忆、动态状态跟踪、工作流知识、环境陷阱识别和前提意识)进行测试,并提供多达451个手动策划的问题及每个问题最多500条轨迹的数据集。技术上,它基于Python开发,支持多模态数据处理与高效查询。适用于需要研究或应用长时记忆机制于Web和企业级场景中的开发者和研究人员。
Python
Apache License 2.052
Stars
8
Forks
1
Watchers
1
Issues
Star 增长
今日0
近 7 天+10
近 30 天+11
综合评分48.96
默认分支main