作者:寇苏玲; 蔡庆生关联检索关键词抽取用户模型
摘要:现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索。以单文档关键词抽取为基础,引人多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向量,建立基于关键词向量空间的用户兴趣模型。通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社