BBuf

kernel-pilot

BBuf

暂无描述

AI 简介

KernelPilot 是一个用于CUDA内核调优的自动化工具,通过结合人类化驱动的GPU内核优化循环、同侪证据路径以及Nsight Compute报告技能来实现。其核心功能包括自动化的研究/迭代/自调优过程、正确性测试、基准测试、账本记录及调度决策等,并能将Nsight Compute报告转化为可重复的性能摘要。该项目特别适合于需要细致调整和验证的CUDA内核开发场景中使用,尤其是在那些容易丢失重要信息(如哪个上游PR启发了候选方案、哪些形状退化了等)的情况下。此外,它还支持从本地PR差异、克隆的外部源映射仓库以及实时网络/官方/上游资源中获取内核证据的能力,确保候选内核不会污染大型框架库的同时提供了独立且干净的研究环境。

Python
165
Stars
28
Forks
97
Watchers
1
Issues

Star 增长

今日0
近 7 天+6
近 30 天+56
综合评分46.99
默认分支main