MSA

EverMind-AI

Memory Sparse Attention - A scalable, end-to-end trainable latent-memory framework for 100M-token contexts.

AI 简介

MSA（Memory Sparse Attention）是一个面向超长上下文的可扩展稀疏注意力框架，支持最高1亿token的端到端可训练记忆建模。其核心技术包括：基于文档级RoPE的可扩展稀疏注意力机制，实现近线性计算复杂度；KV缓存分层压缩与Memory Parallel推理引擎，可在2块A800上完成1亿token推理；以及支持多轮跨段推理的Memory Interleave机制。适用于需要超长记忆能力的场景，如法律文书分析、医学文献综述、超长对话建模及知识密集型问答等对上下文长度和记忆一致性要求极高的任务。

Python

在 GitHub 查看官方网站

3.5k

Stars

226

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+6

综合评分56.67

默认分支main

MSA

Star 增长

加入交流群