
DualPipe
deepseek-ai
A bidirectional pipeline parallelism algorithm for computation-communication overlap in DeepSeek V3/R1 training.
AI 简介
DualPipe是一个用于DeepSeek V3/R1训练中的双向流水线并行算法,旨在实现前向和后向计算-通信阶段的完全重叠,并减少流水线气泡。该项目通过创新的时间调度策略,在保持高效数据传输的同时最大化利用计算资源,适用于需要大规模深度学习模型训练且对计算效率有高要求的场景。技术上,DualPipe支持PyTorch 2.0及以上版本,并提供了两种调度方式:标准DualPipe及简化版DualPipeV,后者采用“切半”过程进一步优化了内存使用与执行效率。对于希望提高分布式训练效率的研究者或工程师而言,DualPipe提供了一个实用而高效的解决方案。
Python
MIT License3k
Stars
326
Forks
31
Watchers
3
Issues
Star 增长
今日+3
近 7 天+7
近 30 天+14
综合评分70.44
默认分支main