作者:熊回香; 叶佳鑫; 蒋武轩dbscan标签聚类用户聚类标签拓展
摘要:【目的】改进DBSCAN算法并验证其在社会化标注中的可行性及有效性。【方法】结合社会化标注的特点,分析标签被用来标注资源的频次及标签的总出现次数,挖掘标签与资源间的联系来改进DBSCAN聚类算法,以改进的算法为基础,实现标签聚类、用户聚类以及用户标签的拓展。【结果】采用豆瓣电影上的数据进行对比实验,改进的DBSCAN算法在应用于社会化标注时可以提高簇内对象间相关性与各簇间相关性的比值,聚类效果得到改进。【局限】在选择构建向量的数据时存在一定局限性,样本数据只能从较笼统的层面表示用户及资源特征,未对其进行深入挖掘。【结论】本文通过分析社会化标注的特点来改进DBSCAN算法,提高算法的效果,并为其改进提供新的思路。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社