作者:许武; 梁军; 李威; 徐鹏飞; 徐圣瑞; 张福...粗粒度并行负载不均衡零复制数据本地化gpu优化异构计算平台
摘要:单纯采用CPU处理激光雷达点云数据已无法满足其实时性需求。为此,选用NVIDIA Tegra X1作为异构计算平台,对激光雷达数据处理算法进行加速。结合硬件架构特征和激光雷达数据处理算法的特性,通过粗粒度并行解决GPU优化过程中出现的负载不均衡问题。同时采用零复制和数据本地化的方法进行数据的精细优化。实验结果表明,相较于目前智能车上使用的工控机,优化后的激光雷达数据处理算法能够加速5倍~6倍,提高了智能车对雷达数据处理的实时性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社