Memento-Teams

Memento

Memento-Teams

Official Code of Memento: Fine-tuning LLM Agents without Fine-tuning LLMs

AI 简介

Memento是一个基于记忆的持续学习框架,旨在帮助大语言模型代理从经验中改进而无需更新模型权重。其核心功能包括无参数更新的记忆增强学习、两阶段规划-执行循环以及案例推理等技术特点。通过记忆增强的马尔可夫决策过程(MDP)和高效的读写操作来存储与重用经验,使得LLM能够在不调整自身权重的情况下进行在线强化学习。此外,它还支持多种工具集成如SerpAPI和vLLM本地部署,进一步提升了开发效率。适用于需要长期学习且对计算资源敏感的应用场景,比如对话系统、个性化推荐等领域。

Python
MIT License
2.5k
Stars
284
Forks
33
Watchers
13
Issues

Star 增长

今日0
近 7 天+8
近 30 天+27
综合评分56.06
默认分支main