
CUDA-Fortran: 此仓库致力于展示Fortran 90中的基础CUDA编程技巧。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:本仓库专注于演示如何在Fortran 90中运用基础的CUDA编程技术,旨在为希望结合Fortran高效数值计算与NVIDIA CUDA强大并行处理能力的开发者提供指导。
CUDA Fortran 90功能测试的目的在于试验Fortran 90中的CUDA编程基础知识。此存储库包含几个小项目,用于测试加速、内存分配以及流传输等功能,并可用作在CUDA中使用Fortran编程的基本参考。
值得一提的是,其中一些示例直接取自PGI CUDA Fortran 编程指南;这些文件夹在其目录名称中标记为“example”。
内容包括:
- 01-get-threadid example-5.1:该部分提供了一个大型矩阵的广泛例子,演示了如何使用CPU(双循环或OpenBLAS)和GPU(cuBLAS和切片)进行矩阵乘法运算。
- example-5.2:演示映射内存分配的副本。
- memory-bandwidth:测量固定和可分页内存在Host到Device以及Device到Host传输的有效性。
- async-data-transfer:评估四种不同数据传输策略下的延迟需求。
全部评论 (0)
还没有任何评论哟~


