融合attention机制的BI-LSTM-CRF中文分词模型

作者：黄丹丹; 郭玉翠中文分词crfattention机制贡献因子去噪机制dropout

摘要：中文的词语不同于英文单词，没有空格作为自然分界符，因此，为了使机器能够识别中文的词语需要进行分词操作。深度学习在中文分词任务上的研究与应用已经有了一些突破性成果,本文在已有工作的基础上，提出融合 Bi-LSTM-CRF模型与attention机制的方法，并且引入去噪机制对字向量表示进行过滤，此外为改进单向LSTM对后文依赖性不足的缺点引入了贡献率？对BI-LSTM的输出权重矩阵进行调节，以提升分词效果。使用改进后的模型对一些公开数据集进行了实验。实验结果表明，改进的attention-BI-LSTM-CRF模型以及训练方法可以有效地解决中文自然语言处理中的分词、词性标注等问题，并较以前的模型有更优秀的性能。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

软件

《软件》（CN：12-1151/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《软件》注重刊登反映计算机应用和软件技术开发应用方面的新理论、新方法、新技术以及创新应用的文章。

杂志详情

服务推荐

软件相关期刊

融合attention机制的BI-LSTM-CRF中文分词模型

服务推荐

在线咨询

杂志订阅

期刊推荐

计算机光盘软件与应用

计算机应用与软件

电子技术与软件工程

软件导刊