基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化
【出 处】:《
计算机工程与科学
》
CSCD
2016年第38卷第2期 202-209页,共8页
【作 者】:
阳王东
[1,2] ;
李肯立
[2]
【摘 要】
稀疏矩阵与向量相乘SpMV是求解稀疏线性系统中的一个重要问题,但是由于非零元素的稀疏性,计算密度较低,造成计算效率不高。针对稀疏矩阵存在的一些不规则性,利用混合存储格式来进行SpMV计算,能够提高对稀疏矩阵的压缩效率,并扩大其适应范围。HYB是一种广泛使用的混合压缩格式,其性能较为稳定。而随着GPU并行计算得到普遍应用以及CPU日趋多核化,因此利用GPU和多核CPU构建异构并行计算系统得到了普遍的认可。针对稀疏矩阵的HYB存储格式中的ELL和COO存储特征,把两部分数据分别分割到CPU和GPU进行协同并行计算,既能充分利用CPU和GPU的计算资源,又能够发挥CPU和GPU的计算特性,从而提高了计算资源的利用效能。在分析CPU+GPU异构计算模式的特征的基础上,对混合格式的数据分割和共享方面进行优化,能够较好地发挥在异构计算环境的优势,提高计算性能。
相关热词搜索: GPU 稀疏矩阵 SpMV CUDA 异构计算 GPU sparse matrix SpMV CUDA heterogeneous computing
上一篇:一种基于Matrix的QR分解向量化方法
下一篇:分区内存体系结构片选指令优化方法