作者:杨宁深度神经网络语音识别图形处理器并行框架
摘要:深度神经网络(DNN)是近年来机器学习领域中的研究热点.它是层数较多的神经网络,有数千万参数需要学习,计算开销大,导致训练非常耗时.而GPU有强大的计算能力,适合于加速深度神经网络训练.针对这种情况,提出了DNN的多GPU并行框架,描述了其实现方法及性能优化,依托多GPU的强大协同并行计算能力,结合数据并行的特点,实现快速高效的深度神经网络训练.对于在语音识别上的应用,其模型收敛速度和模型性能上都取得了有效提升——相比单GPU有4.6倍加速比,字错率降低约10%.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社