作者:邵兵; 杜鹏飞卷积神经网络语音情感识别语音特征提取情感计算
摘要:语音是人与人之间最直接、最自然的交互途径,也是人机交互的重要方式。在人工智能领域,对语音的情感识别和理解至关重要,而一般的语音识别系统在实现语音转文字时往往损失了很多的语音情感信息。该文介绍一种利用卷积神经网络进行语音情感识别的方法。论文首先从心理学与人工智能的角度讨论了情感计算的框架和语音情感识别的方法,然后介绍了语音的关键特征提取和归一化问题,通过40组滤波器来提取每一帧音频的数据,之后通过构建卷积神经网络,对输入的音频特征进行逐层训练,通过特征的逐层表达实现高层显著特征的凸显,最终产生语音情感分类的模型,最后通过一定的数据集,对分类模型进行验证。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社