作者:王琦; 韩林; 高雨辰; 李颖颖; 王曦矩阵转置英特尔第二代至强融合处理器并行优化高带宽内存集群模式
摘要:矩阵转置访存密集,便于并行优化,因此优化矩阵转置程序,旨在分析Knights Landing平台新特性。分析矩阵转置程序特性,按照矩阵一行元素个数,将矩阵分为3类;利用KNL平台提供的AVX-512扩展指令集对其进行向量化优化以及数据预取,利用OpenMP实现两种不同粒度的并行优化;利用矩阵转置程序,通过实验数据对比,分析KNL平台优化程序的特点及其不同模式的不同特性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社