
Flash-Attn Wheel
5星
- 浏览量: 0
- 大小:None
- 文件类型:WHL
简介:
Flash-Attn Wheel是一款创新的注意力机制实现方式,专为加速Transformer模型中的注意力计算而设计。它采用独特的算法优化,大幅提升了处理效率与性能表现,在保持高精度的同时减少内存使用和计算成本。
我使用的是Windows 11操作系统,并在其中创建了一个Python 3.10.0的虚拟环境venv。我在该环境中编译了flash_attn-2.6.3-cp310-cp310-win_amd64,同时安装了cuda12.1。
我通过pip命令使用PyTorch官方索引地址来安装torch、torchvision和torchaudio库,整个编译过程耗时大约为两个小时。
全部评论 (0)
还没有任何评论哟~


