HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于RNN和WFST译码的自动语音识别研究

作者:郑晓琼; 汪晓; 江海升; 樊培培; 张超自动语音识别eesen递归神经网络加权有限状态换能器连接时间分类

摘要:文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。为了消除对预生成帧标签的需求,采用了连接时间分类(CTC)目标函数来推断语音和标签序列之间的对齐。同时,采用基于加权有限状态换能器(WFST)的广义译码方法,将词汇和语言模型有效地整合到CTC译码中。实验结果表明,与混合HMM/DNN模型相比,所提方法具有较低的误码率(WER),同时显著加快了译码速度。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息技术

《信息技术》(CN:23-1557/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息技术》的办刊宗旨是:大力宣传国家信息基础建设和信息产业发展形势,深入报导国内外信息技术(产品)发展趋势,交流信息化建设经验,推介信息产业界精英及其管理思想,提供信息技术(产品)市场前景与分析。

杂志详情