Data/AIPythonMIT
FlashQLA
FlashQLA é uma biblioteca de kernels de atenção linear baseada em TileLang, com fusão de operadores e reformulações para acelerar treinamento e inferência em GPUs NVIDIA Hopper.
- Stars
- 422
- Forks
- 29
- Atualizado
- 01/05/2026
- Repo
- QwenLM/FlashQLA