HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于CTC准则的普通话识别及改进

作者:张立民; 王彦哲; 张兵强; 朱念斌序列级端到端解码声学特征区分度训练

摘要:主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构。在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征。利用序列区分度训练技术提升CTC模型的建模效果。实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09%±0.16%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

《计算机工程》(CN:31-1289/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机工程》特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。

杂志详情