HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于句群的自动文摘方法

作者:王荣波; 张璐瑶; 李杰; 黄孝喜; 周昌乐自动文摘句群主题模型聚类

摘要:针对目前多数基于句子或段落作为处理单元的自动文摘方法,提出一种基于句群的自动文摘方法。该方法引用了一种基于多元判别分析(MDA)的汉语句群自动划分理论,通过获得句间语义更好的句群作为自动文摘的处理粒度,在此基础上使用潜在狄利克雷分配(LDA)主题模型将文本表示成向量矩阵,再使用k-means算法对向量进行聚类,然后按照一定比例从聚类后的类别中抽取生成文摘,最后采用Kappa检验和肯德尔相关系数评价摘要的质量。实验结果表明该方法得到的整体Kappa值达到了0.7、肯德尔相关系大于0.8,两个评价指标结果都高于各自较好等级的评价值,因此以句群作为处理粒度的自动文摘方法较传统的以句子作为处理粒度的方法能生成质量更好的文摘。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用

《计算机应用》(CN:51-1307/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情