作者:彭飞 顾乃杰 高翔 孙明明编译优化simd自动向量化builtin龙芯3b
摘要:根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访存方法,并详细介绍了适合龙芯3B的SIMD访存方法.对于不能自动向量化的其他SIMD运算,在GCC编译器中增加了Builtin函数的支持,用户可以根据标准函数接口调用SIMD运算函数,完成向量操作.通过对SPEC.CPU2000、DSPstone等大量benchmark的测试和分析,给出了龙芯3BSIMD运算的各项性能指数.对于性能表现不同的测试函数,均给出了详细分析数据和结论.测试表明,龙芯3B的SIMD运算在实际应用中有着良好的性能表现.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社