作者:卜禹; 陆璐璐深度信念网络卷积神经网络核典型关联分析最近邻分类器说话人识别
摘要:论文提出一种基于深度学习以及核典型相关分析(kernel canonical correlation analysis,CCA)的多特征融合说话人识别方法。针对说话人的音频和视频信息,利用深度信念网络和卷积神经网络这两种不同深度的神经网络对音频信息和视频信息分别并行处理,得到两种不同模态的生物特征向量。采用核典型相关分析方法对这两种非线性相关的特征向量进行特征级融合,使用它们的相关性判别函数抽取多个相关性顺次下降但又互不相关的典型变量对按照给定的特征级融合策略构成最后的判别特征,同时去除了冗余信息。最后生成的基于核典型关联分析的融合特征输入最近邻分类器,输出说话人识别结果。使用BANCA数据库对该方法进行实验,结果表明:该方法能显著提高说话人识别的准确率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社