czg1225

DMax

czg1225

DMax: Aggressive Parallel Decoding for dLLMs

AI 简介

DMax 是一种新的高效解码范式,旨在为扩散语言模型(dLLMs)实现激进的并行解码同时保持生成质量。其核心功能包括通过自修正机制在解码过程中修正错误预测、使用软并行解码技术传播先前步骤的信心先验值,从而在数学和代码任务上分别达到6.0 TPF和6.6 TPF的同时保持准确性。DMax 适合需要高效率与高质量文本生成的应用场景,如大规模语言模型推理、代码生成及数学问题求解等。此项目采用Python编写,并遵循Apache License 2.0开源许可协议。

Python
Apache License 2.0
126
Stars
7
Forks
1
Watchers
1
Issues

Star 增长

今日0
近 7 天+4
近 30 天+14
综合评分46.11
默认分支main