面向FT1000微处理器的STREAM并行计算与优化
【出 处】:《
计算机工程与科学
》
CSCD
2014年第36卷第12期 2267-2271页,共5页
【作 者】:
迟利华
;
胡庆丰
;
刘杰
;
甘新标
;
蒋杰
;
晏益慧
【摘 要】
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。
相关热词搜索: 多线程微处理器 STREAM测试程序 性能优化 multithreaded processor STREAM benchmark performance optimization
上一篇:胖树的网络演算模型
下一篇:基于变化的服务演化一致性判定