HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于fastText模型的词向量表示改进算法

作者:阴爱英; 吴运兵; 郑一江; 余小燕词向量fasttext模型自然语言处理

摘要:传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次,针对fastText模型中n-gram分解格式进行限定,将分解条件设置为符合英文单词的组成结构;最后,去除fastText模型中单词前后缀标记符,减少无用分解对模型预测产生干扰.实验结果表明,与fastText模型相比,所提出的改进模型在单词关系评分、语义相似性、句法相似性均取得较好的准确率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

福州大学学报·自然科学版

《福州大学学报·自然科学版》(CN:35-1337/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《福州大学学报·自然科学版》主要刊载数学、物理、电气、信息科学与技术、自动控制、机械、材料、土木建筑、化学化工、生物、轻工、资源、环保等学科的最新研究成果。

杂志详情