作者:熊冰峰; 曾以成; 谢小娟说话人识别频谱泄露汉明自卷积窗全极点gammatone滤波器高斯混合模型
摘要:针对主流的语音特征参数梅尔频率倒谱系数(MFCC)和伽马通倒谱系数(GFCC)作为说话人个性特征,在低信噪比的环境下,说话人识别率下降较快的问题,提出一种改进的听觉特征参数应用于说话人识别。在语音信号预处理过程中,提出一种汉明自卷积窗代替经典窗函数,抑制频谱泄露,提高信号的信噪比;从模拟人耳基底膜特性的角度出发,为了更好地模拟基底膜滤波非对称特性,采用全极点Gammatone滤波器提取特征,得到改进的听觉特征参数。在高斯混合模型识别系统中进行仿真实验,实验结果表明,改进的听觉特征参数应用于说话人识别系统,识别正确率都优于线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)和Gammatone滤波器倒谱系数(GFCC),而且在信噪比低的环境中,系统仍然有较高的识别率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社