HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统

作者:茅正冲; 王俊俊能量算子耳蜗倒谱系数说话人识别

摘要:为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔伯特变换从TEO导出分析信号的瞬时相位信息,结合耳蜗倒谱系数(Cochlear filter cepstral coefficients,CFCC)得到融合特征参数。实现了对特征参数的补偿,提高了说话人识别系统的识别率。使用NIST-2002说话者识别评估(Speakers recognition evaluation,SRE)数据库,在高斯混合模型-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)的说话人识别系统上进行实验。实验结果表明TEO相位与CFCC的结合比单独CFCC更好,其识别精度比现有的CFCC特征和线性预测梅尔频率倒谱系数(Linear prediction Meyer frequency cepstral coefficient,LPMFCC)分别提高了8.32%和3.15%。这表明TEO相位包含与CFCC特征互补的信息,且具有较高的识别率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京理工大学学报

《南京理工大学学报》(CN:32-1397/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京理工大学学报》报道科技新动态,内容丰富,包括机械工程、电子工程、机电工程、光电技术、化学工程、环境科学、计算机科学、信息工程、自动控制与系统工程、热能工程、材料科学与工程、应用数学、应用物理、应用力学和管理工程等方面的高层次学术论文。

杂志详情