HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于聚类与语义相似分析的多文本自动摘要方法

作者:杜秀英自动摘要云计算多文本聚类语义相似分布式处理

摘要:方法 杜秀英(广州航海学院图书馆广州510725)摘要[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间性能,同时也具有较好的压缩效果并保证较高的摘要质量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报

《情报杂志》(CN:61-1167/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《情报杂志》以情报学服务国家安全、服务政府及企业决策为宗旨,以情报学理论与情报工作实践,情报分析方法与技术、情报管理与服务、情报机构与情报人才等为培育方向,重点关注:情报研究、智库建设、舆情研究、信息分析、知识发现、情报服务、信息计量研究、文献计量研究、网络计量研究、信息资源管理等。

杂志详情