作者:叶苗群web日志挖掘web服务器模糊聚类算法访问路径web页面web站点日志文件关联矩阵访问次数url列向量行向量群体客户相似相关
摘要:通过对Web服务器日志文件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径.在本文算法中,首先以Web站点的URL为行、以UserID为列建立URL-UserID关联矩阵,其元素值为用户的访问次数.然后,采用模糊聚类算法和K-平均算法两种方法分别对列向量进行分析得到相似客户群体,对行向量进行分析可获得相关页面,对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社