CUDA在GPU高性能计算中的应用实例。

5星

浏览量: 0

大小:None

文件类型：None

简介：
GPU高性能计算系列丛书的首部著作《GPU高性能计算之CUDA》已正式问世，由张舒、褚艳利、赵开勇以及张钰勃共同完成。本书不仅详细阐述了CUDA的软硬件架构，并提供了C for CUDA程序开发和优化策略的深入指导，还包含了大量实例，旨在为读者提供学习和参考的宝贵资源。下方表格列出了各个实例的具体介绍信息。文件夹对应于书中章节，并附有备注说明。ACsearch_DPPcompact_with_driver 5.2.2 涉及多模式匹配算法的应用；asyncAPI 2.5 展示了异步API调用的示例；bandwidthTest 2.3.6 用于带宽测试；Bitonic 5.1.1 涵盖了双调排序网络的设计与实现；conjugateGradient 5.2.1 介绍了共轭梯度算法及其在CUBLAS中的实现方式；cudaMPI 2.7.3 则展示了CUDA与MPI结合管理GPU集群的方法；cudaOpenMP 2.7.2 提供了一种利用OpenMP管理多GPU的方案；deviceQuery 2.1.4 用于设备查询操作；histKernel 2.4.3 展示了亮度直方图统计的应用；matrixAssign 2.1.4 详细说明了矩阵赋值的操作；matrixMul 4.7.1 阐述了矩阵乘法及其在共享内存中的应用，同时还介绍了矩阵乘法利用寄存器进行归约的优化方法；matrixMul_Berkeley 4.7.1 进一步探讨了基于Berkeley算法的矩阵乘法，并强调了寄存器技术的运用；reduction 4.7.2 描述了并行归约（缩减）程序的实现细节；scan 5.1.2 介绍了Scan算法及其在计算前缀和方面的应用，同时涵盖了大数组处理的场景；scanLargeArray 5.1.2 更深入地探讨了Scan算法在处理大数组时的有效性；simpleCUBLAS 5.1.3 展示了CUBLAS库的基本应用示例; simpleCUFFT 5.1.4 阐述了CUFFT库的基本使用方法; simpleD3D9 2.6.2 说明了CUDA与Direct3D9之间的互操作性; simpleD3D10 2.6.2 详细介绍了CUDA与Direct3D10之间的互操作性; simpleGL 2.6.1 展示了CUDA与OpenGL之间的互操作性; simpleMultiGPU 2,7,1 提供了多设备控制的相关内容; simpleStreams 2,5,2 说明了流的使用演示方法; simpleTexture 和 simpleTextureDrv (版本为：2,3,8) 分别展示了简单的纹理使用及通过驱动API实现的纹理使用方式; sortingNetworks 的设计与实现以及处理大数组的方法被详细描述; threadMigration 通过上下文管理和设备管理功能实现了多设备并行计算的功能; timing (版本为：4,2,1) 展示了设备端测时的方法; transpose (版本为：4,7,3) 说明了矩阵转置的操作以及考虑partition conflict 的方法; VectorAdd (版本为：２、２、３/２、３、４) 及 VectorAddDrv (版本为：２、２、３/２、３、４) 展示矢量加运算及其对应的驱动API实现。

全部评论 (0)

还没有任何评论哟~

是否确定退出登录?

CUDA在GPU高性能计算中的应用实例。

全部评论 (0)