作者:刘景勇; 柴佩琪; 姚秋明tts系统解决方案汉语字问题分类回归树统计学习基于特征动态更新试验对比cart多音字词典权值复杂度实验
摘要:多音字现象的存在给汉语TTS(Text to Speech)系统增加了难度.本文旨在提出一种解决中文TTS系统中的多音字判决问题的统一方案.这种方案基于统计学习的思想.首先构造一个基于特征的词典,该词典可以根据学习的语料动态更新.在有权值和无权值两种更新词典的方法中,通过试验对比最终选择了无权值的方法.我们采取建立规则的办法作为对词典的补充,分别用分类回归树(CART)、扩展的随机复杂度(ESC)进行了实验.通过实验,最终以CART生成的局部规则对词典进行补充,得到了较为满意的效果.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社