中文Web检索中聚类算法的改进

作者：耿玉良; 陈家琪; 王咏梅文本聚类算法信息检索web挖掘

摘要：对基于混合相似度的HTFC算法进行改进,要做的预处理是:建立向量空间模型,计算文档和链接的混合相似度.算法过程是:首先随机选取√kn个文档进行层次聚类,直到剩k个聚簇为止;对这k个聚簇不断迭代直到集合元素不再变化为止;然后表示出每类;最后通过用户对结果的反馈使得新生成的簇继续迭代,最终满足用户需求.算法第1步采用的是改进的k-means算法,可提高运行效率.反馈机制对原有模型进一步修正,从而提高精度.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机工程与设计

《计算机工程与设计》（CN：11-1775/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

计算机工程与设计相关期刊

中文Web检索中聚类算法的改进

服务推荐

在线咨询

杂志订阅

期刊推荐

中国组织工程研究

网友世界

科学技术与工程

计算机光盘软件与应用