dllm

ZHZisZZ

dLLM: Simple Diffusion Language Modeling

AI 简介

dLLM 是一个用于训练和评估扩散语言模型的库，旨在提高开发流程的透明度和可复现性。它基于 `transformers` 框架提供可扩展的训练管道，并支持 LoRA、DeepSpeed 和 FSDP 等技术，同时通过 `lm-evaluation-harness` 提供统一的评估管道，简化了推理细节和自定义过程。dLLM 适用于需要高效训练、推理和评估开放权重模型（如 LLaDA 和 Dream）的场景，以及实现特定训练算法（如 MDLM、BD3LM 和 Edit Flows）。该项目适合研究人员和开发者在自然语言处理领域进行实验和应用开发。

Python

Apache License 2.0

discrete-diffusion-models llm nlp

在 GitHub 查看官方网站

2.6k

Stars

267

Forks

Watchers

Issues

Star 增长

今日0

近 7 天+7

近 30 天+64

综合评分69.18

默认分支main