简介:本文介绍了MatVec-MPI,一种高效的稀疏矩阵-向量乘法并行计算方法,利用MPI在多处理器环境中实现了显著加速,适用于大规模科学与工程计算。
在使用 MPI 并行化稀疏矩阵向量乘法的过程中,在第一步采用一维行分解读取文件并将数据分配给所有处理器,这需要 O(n) 时间复杂度然后是O(nnz),其中 n 代表行数而 nnz 表示非零元素的数量。矩阵 A 的数据以 CSR(Compressed Sparse Row)格式读入并存储,在这种格式下包括三个数组:行指针、列索引和值。
在第一步中,使用 MPI Bcast 将数据分发给 p 个处理器,并且每个进程准备通过 prepareRemoteVec 函数获取它需要的非本地向量元素。在此过程中,遍历矩阵的局部列索引来确定所需的远程向量条目是什么,在调整了本地向量的数据数组大小后(新的大小为 vSize + numRemoteVec),以在末尾保存来自其他处理器的附加远程向量条目。
最后一步是重新映射本地列索引数组,即之前指向全局向量数据索引的部分。通过遍历这个局部列索引数组,并将其调整到正确的指向下标位置来完成这一过程。