作者:邓贺元; 刘加; 夏善红; 彭春荣深度学习时间频率掩蔽值空间特征波束成形
摘要:近年来,越来越多的电子产品使用麦克风阵列,而且与传统多通道语音增强算法相比,基于深度学习的算法效果更好,为了进一步提高增强效果,提出一种联合频谱特征和空间特征的深度学习算法。该算法包括两个部分,第一部分,使用频谱和通道间相位差特征估计时间频率掩蔽值,然后进行基于掩蔽值的波束成形;第二部分,使用方向特征和频谱特征进行进一步的增强。在CHiME4数据集上的实验证明了该算法的有效性,与仅使用频谱特征的方法相比,在真实数据上的词错误率相对降低27.6%,在仿真数据上的主观语音质量评估得分从2.46提高到2.81。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社