作者:漆月; 石璐文本相似度语义分析评价指标体系
摘要:现有图书馆采选系统只能实现对书号、题名的重复检查,但图书出版同质化日益严重,针对异号相似图书困难的问题,构建基于自然语言处理技术的策略。首先选择主题词、内容提要和目录作为图书内容特征的指标进行建模,利用Word2Vec和WMD技术实现不同长度特征文本语义化相似度计算;然后,采用AHP方法计算特征相似度的权系数,得到图书相似度的综合评价指标;最后以西南大学图书馆数据为实验对象,验证策略的可行性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社