
cutile-python
NVIDIA
cuTile is a programming model for writing parallel kernels for NVIDIA GPUs
AI 简介
cuTile Python 是一个用于编写 NVIDIA GPU 并行内核的编程模型。它支持通过 Python 代码定义并行计算任务,并利用 Tile IR 自动生成高效的 GPU 内核,从而简化了 GPU 编程流程。其核心功能包括基于 tile 的数据加载与存储、自动化的内存管理和优化的并行执行策略。特别适合需要高效处理大规模数据集的应用场景,如科学计算、深度学习和图像处理等。使用 cuTile Python 可以显著降低开发者接触底层 GPU 编程细节的门槛,同时保持高性能计算的优势。
Python
Other2.1k
Stars
140
Forks
19
Watchers
12
Issues
Star 增长
今日0
近 7 天+5
近 30 天+21
综合评分63.05
默认分支main