作者:傅间莲; 陈群秀计算机应用中文信息处理自动文摘向量空间模型段落相似度主题划分
摘要:随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优势,使得其实用价值得到充分体现.而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题.本文提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性.实验结果表明,该算法对多主题文章的主题划分准确率为92.2%,对单主题文章的主题划分准确率为99.1%.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社