HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于深度神经网络模型的中文分词方案

作者:许峰; 张雪芬; 忻展红中文分词长短期记忆网络词向量准确率f值

摘要:针对目前已有的分词算法和程序在处理海量网络文本分词时性能下降的问题,本文提出了一种基于深度神经网络模型的中文分词方案。该方案利用基于长短期记忆网络的编码-解码模型对数据模型进行训练,并采用得到的模型进行分词。为了提升分词性能,进一步提出了一种基于词向量的修正方法,对采用上述模型的分词结果进行修正。对典型微博语料数据集的实验结果表明,提出基于模型的分词性能相对于传统的分词软件的分词性能有了较大提升。采用提出的词向量修正方法修正后的分词准确率和F值略优于未修正的分词准确率和F值,从而验证了论文提出的分词方案的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

哈尔滨工程大学学报

《哈尔滨工程大学学报》(CN:23-1390/U)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《哈尔滨工程大学学报》曾荣获工业与信息化部“优秀科技期刊奖”、黑龙江省政府“优秀期刊奖”,以及教育部“中国高校精品科技期刊奖”、“中国高校优秀科技期刊奖”等多项荣誉。

杂志详情