作者:王寒茹; 张仰森距离公式相似度计算方法词语相似度句子相似度篇章相似度
摘要:相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹配。针对现有需求,对于不同粒度的文本,研究出一套适合大规模实际应用的相似度计算方法体系迫在眉睫。从方法论的角度,对目前主流的相似度计算方法进行总结,介绍了不同粒度的文本相似度计算的差别以及近几年的研究进展,总结了目前相似度计算方向存在的问题,并对发展趋势进行了展望。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《北京信息科技大学学报·自然科学版》(CN:11-5866/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《北京信息科技大学学报·自然科学版》是美国“剑桥科学文摘(CSA)数据库、俄罗斯“文摘杂志”、“中国期刊全文数据库”、“中国优秀期刊(遴选)数据库”、“中国知网”、“万方”等多家数据库来源期刊。
杂志详情