ZacharyNovack

live-music-diffusion-models

ZacharyNovack

暂无描述

AI 简介

Live Music Diffusion Models (LMDMs) 是一个用于生成实时音乐的流式自回归扩散模型。项目提供了训练和推理代码,能够逐块生成音频,并支持滑动窗口上下文,适用于实时音乐生成。该模型基于PyTorch 2.5+构建,采用Flash/Flex Attention技术以提高性能。提供了两种注意力机制配置(编码-解码和块因果),每种机制都有基础微调版本和ARC-forcing版本。适合需要进行高质量实时音频生成的应用场景,如现场音乐表演、在线音频创作等。

Python
MIT License
44
Stars
3
Forks
1
Watchers
1
Issues

Star 增长

今日0
近 7 天+1
近 30 天+2
综合评分39.51
默认分支master