HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于web日志挖掘的数据预处理研究

作者:曹明; 闪四清web日志挖掘数据挖掘会话识别事务识别

摘要:Web日志信息的预处理是Web日志挖掘任务中的重要阶段,也是工作量较大的一部分.Web服务器上的数据是半结构化的,而且含有大量和挖掘无关的记录和冗余项.这就需要对其进行处理以得到适合挖掘的数据事务(Transaction)形式.Web日志预处理就是通过一系列的清洗、集成、转换等来得到合适的待挖掘数据.本文重点介绍了数据清理、用户识别、会话识别、路径补充、事务识别等过程.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

科技资讯

《科技资讯》(半月刊)创刊于2003年,由北京市科学技术研究院主管,北京国际科技服务中心;北京合作创新国际科技服务中心主办,CN刊号为:11-5042/N,自创刊以来,颇受业界和广大读者的关注和好评。 《科技资讯》主要刊登中外新技术、新材料、新设备、新工艺及融投资项目的新资讯,并刊发能反映中外新技术发展动态,新产品开发进展及概述各学科新发展方向的内容。杂志社现向各级政府机关、相关单位、学校等征集学术论文。

杂志详情