RightNow-AI

autokernel

RightNow-AI

Autoresearch for GPU kernels. Give it any PyTorch model, go to sleep, wake up to optimized Triton kernels.

AI 简介

AutoKernel 是一个用于自动优化 GPU 内核的工具,能够接收任意 PyTorch 模型,并自动生成优化后的 Triton 或 CUDA C++ 内核。其核心功能包括模型性能分析、瓶颈内核提取与独立优化、以及最终的整体验证和加速报告。采用自主代理技术,通过不断修改、测试并保留或回滚更改来实现持续优化。该工具适用于需要提升深度学习模型在GPU上运行效率的场景,特别是对于那些希望减少手动调优工作量的研究人员和开发者来说非常有用。支持 NVIDIA H100/A100/RTX 4090 等显卡及 Python 3.10+ 环境。

Python
MIT License
1.4k
Stars
141
Forks
12
Watchers
8
Issues

Star 增长

今日+10
近 7 天+16
近 30 天+47
综合评分87.16
默认分支main