作者:杨振浩; 郑启龙; 邓文齐; 王向前位反序寻址bwdspfft向量化
摘要:魂芯DSP(BWDSP)系列处理器由中国电子科技集团第38研究所研制,支持VLIW(Very Long Instruction Word,超长指令字)和SIMD(Single Instruction Multiple Data,单指令多数据流)技术,被广泛运用于各种高性能计算领域.快速傅里叶变换(Fast Fourier Transform,FFT)是数字信号处理、图像处理等领域的基本研究工具.目前由于BWDSP处理器的访存带宽限制,通用的向量化FFT算法未能充分挖掘其计算资源,面临算法性能较低的问题.针对该问题,本文结合BWDSP处理器的体系结构特征深入剖析FFT算法,提出了支持高效访存的并行FFT算法.实验结果表明,在BWDSP100处理器上该算法平均性能达到7.61Gflops,是串行FFT的16.54倍,普通向量化FFT的4.03倍.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社