alexandercodes4

AirTrain

alexandercodes4

Distributed ML training across Apple Silicon Macs

AI 简介

AirTrain 是一个用于在多台 Apple Silicon Mac 设备上进行分布式机器学习训练的项目。它通过 DiLoCo 算法实现近乎线性的扩展,相比传统的分布式训练方法减少了 500 倍的网络通信量,使得基于 Wi-Fi 的训练成为可能。核心功能包括零配置设备发现、容错机制、检查点接力以及为 Apple Silicon 架构优化的本地监控面板。适合场景包括需要降低成本且对网络带宽要求不高的机器学习模型训练任务,特别是在没有云 GPU 资源的情况下,可以利用现有的 Mac 设备资源来完成训练。

Python
MIT License
104
Stars
9
Forks
1
Watchers
1
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分43
默认分支master