HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种改进的听觉特征参数应用于说话人识别

作者:熊冰峰; 曾以成; 谢小娟说话人识别频谱泄露汉明自卷积窗全极点gammatone滤波器高斯混合模型

摘要:针对主流的语音特征参数梅尔频率倒谱系数(MFCC)和伽马通倒谱系数(GFCC)作为说话人个性特征,在低信噪比的环境下,说话人识别率下降较快的问题,提出一种改进的听觉特征参数应用于说话人识别。在语音信号预处理过程中,提出一种汉明自卷积窗代替经典窗函数,抑制频谱泄露,提高信号的信噪比;从模拟人耳基底膜特性的角度出发,为了更好地模拟基底膜滤波非对称特性,采用全极点Gammatone滤波器提取特征,得到改进的听觉特征参数。在高斯混合模型识别系统中进行仿真实验,实验结果表明,改进的听觉特征参数应用于说话人识别系统,识别正确率都优于线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)和Gammatone滤波器倒谱系数(GFCC),而且在信噪比低的环境中,系统仍然有较高的识别率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用

《计算机应用》(CN:51-1307/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情