HI,欢迎来到学术之家,期刊咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

汉语语言集外词检索算法的改进研究

作者:王旭阳 张鹏远 潘接林 颜永红检索集外词令牌传递置信度重估

摘要:针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由于数据稀疏问题,集外词在语言模型上建模不够充分,导致解码过程中难以存留下包含集外词的路径。本文根据深度神经网络在声学模型上建模的准确性,提出了在解码过程中利用令牌保存的局部声学信息以保留那些局部声学概率高而即将被剪枝掉的令牌,从而在词图中保留下来包含集外词的路径,提高集外词检索的召回率;然后再利用关键词置信度重估技术提高集外词检索的精度。实验表明,利用解码过程中的局部声学信息可以提高集外词检索的性能,召回率相对于基线系统有10%的绝对提高;在高精度区,使用置信度重估后本文提出的方法同样取得显著提高。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

网络新媒体技术

《网络新媒体技术》(CN:10-1055/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情