作者:刘秉权; 王晓龙面向用户语言模型机器学习线性结构
摘要:为改善语言模型的自适应能力,提出的面向用户的语言模型在组织结构上由通过大规模平衡语料的训练得到的通用语言模型(其原始参数维持不变)和通过在线学习得到的用户模型(其参数采用先进先出技术动态更新)组成;在数据存储结构上,通用模型采用多级索引结构来解决数据稀疏问题,用户模型采用线性结构表示,用二分法查找.根据最大限度纠正语言模型的转换错误和避免语言模型不平衡的原则,提出了适应汉语N-gram模型的机器学习方法.实验结果表明,这种机器学习方法具有'强化'特点,和'渐进学习'方式一起为应用系统提供了更灵活的选择.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社