
CUDA在GPU高性能计算中的应用实例。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
GPU高性能计算系列丛书的首部著作《GPU高性能计算之CUDA》已正式问世,由张舒、褚艳利、赵开勇以及张钰勃共同完成。本书不仅详细阐述了CUDA的软硬件架构,并提供了C for CUDA程序开发和优化策略的深入指导,还包含了大量实例,旨在为读者提供学习和参考的宝贵资源。下方表格列出了各个实例的具体介绍信息。文件夹对应于书中章节,并附有备注说明。ACsearch_DPPcompact_with_driver 5.2.2 涉及多模式匹配算法的应用;asyncAPI 2.5 展示了异步API调用的示例;bandwidthTest 2.3.6 用于带宽测试;Bitonic 5.1.1 涵盖了双调排序网络的设计与实现;conjugateGradient 5.2.1 介绍了共轭梯度算法及其在CUBLAS中的实现方式;cudaMPI 2.7.3 则展示了CUDA与MPI结合管理GPU集群的方法;cudaOpenMP 2.7.2 提供了一种利用OpenMP管理多GPU的方案;deviceQuery 2.1.4 用于设备查询操作;histKernel 2.4.3 展示了亮度直方图统计的应用;matrixAssign 2.1.4 详细说明了矩阵赋值的操作;matrixMul 4.7.1 阐述了矩阵乘法及其在共享内存中的应用,同时还介绍了矩阵乘法利用寄存器进行归约的优化方法;matrixMul_Berkeley 4.7.1 进一步探讨了基于Berkeley算法的矩阵乘法,并强调了寄存器技术的运用;reduction 4.7.2 描述了并行归约(缩减)程序的实现细节;scan 5.1.2 介绍了Scan算法及其在计算前缀和方面的应用,同时涵盖了大数组处理的场景;scanLargeArray 5.1.2 更深入地探讨了Scan算法在处理大数组时的有效性;simpleCUBLAS 5.1.3 展示了CUBLAS库的基本应用示例; simpleCUFFT 5.1.4 阐述了CUFFT库的基本使用方法; simpleD3D9 2.6.2 说明了CUDA与Direct3D9之间的互操作性; simpleD3D10 2.6.2 详细介绍了CUDA与Direct3D10之间的互操作性; simpleGL 2.6.1 展示了CUDA与OpenGL之间的互操作性; simpleMultiGPU 2,7,1 提供了多设备控制的相关内容; simpleStreams 2,5,2 说明了流的使用演示方法; simpleTexture 和 simpleTextureDrv (版本为:2,3,8) 分别展示了简单的纹理使用及通过驱动API实现的纹理使用方式; sortingNetworks 的设计与实现以及处理大数组的方法被详细描述; threadMigration 通过上下文管理和设备管理功能实现了多设备并行计算的功能; timing (版本为:4,2,1) 展示了设备端测时的方法; transpose (版本为:4,7,3) 说明了矩阵转置的操作以及考虑partition conflict 的方法; VectorAdd (版本为:2、2、3/2、3、4) 及 VectorAddDrv (版本为:2、2、3/2、3、4) 展示矢量加运算及其对应的驱动API实现。
全部评论 (0)


