一种基于Matrix的QR分解向量化方法
【出 处】:《
计算机工程与科学
》
CSCD
2016年第38卷第2期 210-216页,共7页
【作 者】:
鲁庆男
;
刘仲
【摘 要】
提出一种基于Matrix的Givens旋转的QR分解向量化方法。针对Matrix的体系结构特点,对向量数据访存和计算进行优化,使计算均衡分布到各个向量处理单元;设计双缓冲DMA的数据传输策略,使得内核的计算与DMA数据搬移的时间完全重迭,内核始终处于峰值计算,从而取得最佳的计算效率。实验结果表明,该方法能够取得较高的计算效率和性能加速比。
相关热词搜索: QR分解 向量处理器 Givens旋转 软件流水 QR decomposition vector processor Givens rotation software pipeline
上一篇:基于Hadoop的可视化DeepWeb采集平台设计
下一篇:基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化