HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

蒙古语词向量评测研究

作者:乌云塔那; 王斯日古楞词向量cbow模型词向量质量语义语法相似度

摘要:词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

广西科学院学报

《广西科学院学报》(季刊)创刊于1982年,由广西科学院主办,CN刊号为:45-1075/N,自创刊以来,颇受业界和广大读者的关注和好评。 《广西科学院学报》始终坚持以马列主义、思想、邓小平理论和“三个代表”重要思想为指导,刊登了大量广西自然科学各领域的学术论文和具有创造性的科研成果,为活跃自然科学的理论研究,促进科技成果向生产力转化,繁荣科学技术事业,推动科技成果在国内外的交流作出了积极的贡献。

杂志详情