
mlsys2026-flashinfer-contest
mit-han-lab
暂无描述
AI 简介
该项目是为MLSys 2026 FlashInfer竞赛设计的,旨在通过完全由代理驱动的优化工作流程来生成高效的内核代码。核心功能包括使用Humanize框架进行计划与执行验证循环、KernelWiki提供广泛的内核知识库以及Nsight Compute Profile Skills实现更细粒度的性能分析。这些技术共同作用于三个阶段的优化流程中,显著提升了内核开发效率与质量,在MoE、DSA和GDN三个赛道上分别取得了第一、第二和第三名的成绩。适用于需要高性能计算内核优化的场景,尤其是当目标是通过自动化工具加速软件开发过程时。
Python
80
Stars
3
Forks
40
Watchers
0
Issues
Star 增长
今日+3
近 7 天+14
近 30 天+40
综合评分52.81
默认分支main