HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

医院网站日志挖掘数据预处理的研究

作者:蒙华; 苏静; 李立峰; 翟玉兰医院网站日志挖掘数据预处理用户识别页面聚类相似度矩阵

摘要:数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

重庆理工大学学报·自然科学

《重庆理工大学学报·自然科学》(CN:50-1205/T)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《重庆理工大学学报·自然科学》以政治哲学、工商管理、法学、语言文学为主要刊登内容,集学术性、知识性、实用性于一体,理论联系实际。

杂志详情