MindLab-Research

delta-Mem

MindLab-Research

Repo of Paper: delta-Mem: Efficient Online Memory for Large Language Models

AI 简介

δ-mem是一个为大型语言模型设计的高效在线记忆机制。它通过将当前信息投影到低维记忆空间并利用delta规则学习来更新状态,从而实现动态记忆更新。项目使用Python编写,提供了包括训练脚本、评估脚本以及一个交互式聊天演示在内的完整实现。δ-mem特别适用于需要长期保持对话连贯性的场景,如客服机器人或个人助手等应用环境,能够有效减轻上下文负担同时保持模型内部计算的灵活性。目前公开版本主要基于Qwen3-4B/8B和SmolLM3-3B实验,并支持三种写入策略:TSW、SSW与MSW。

Python
41
Stars
4
Forks
28
Watchers
1
Issues

Star 增长

今日0
近 7 天+8
近 30 天+8
综合评分43.9
默认分支main