作者:贺苏宁; 虞厥邦训练样本集数字语音识别模型置信度评估自适应反馈学习dtw匹配模式
摘要:本文通过对小训练样本集的基于DTW结构的数字语音识别模型的比较性分析,指出其存在的三个一般性问题:(1)DTW逐帧匹配模式割裂了观测向量序列的内在联系;(2)压扩观测向量序列造成局部信息使用的不均匀;(3)计算复杂度高,识别率低.为了解决这些问题,我们提出了基于数字语音时频信息整体结构的单特征向量识别模型.这种模型完整地利用了观测向量序列的全部信息,结合置信度评估和自适应反馈学习之后可及时地吸收测试向量携带的新的环境特征信息,调整识别模型结构.该模型的错识率较之最好的基于DTW结构的混合域模型的错识率降低50%以上,计算复杂度则是固定帧长模型的13.12%.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社