HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

应用于用户兴趣建模的多文本关键词抽取研究

作者:寇苏玲; 蔡庆生关联检索关键词抽取用户模型

摘要:现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索。以单文档关键词抽取为基础,引人多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向量,建立基于关键词向量空间的用户兴趣模型。通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机仿真

《计算机仿真》(CN:11-3724/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情