
flashlib
FlashML-org
Fast and memory-efficient classical machine learning operators
AI 简介
FlashLib是一个快速且内存高效的经典机器学习算子库,支持多种算法如KMeans、DBSCAN、PCA等。该项目基于Triton和CuteDSL构建,利用GPU加速实现了15种高级算子,涵盖聚类、最近邻、分解、流形学习、回归及分类等领域,并提供了多精度GEMM变体等低级线性代数原语。其特色功能包括通过`flashlib.info`模块在纯CPU环境下快速预测运行时间、FLOPs和HBM字节数的能力,这有助于在无GPU环境中进行预算规划。FlashLib适用于需要高效处理大规模数据集的经典机器学习任务场景,特别是在资源受限或对性能有高要求的应用中表现优异。
Python
Apache License 2.0506
Stars
36
Forks
2
Watchers
0
Issues
Star 增长
今日+4
近 7 天+68
近 30 天+280
综合评分86.7
默认分支main