GPU

斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快

内核100行代码让H100比使用FA2性能提升30%

西风 2024-06-06