HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种Web使用挖掘数据清理方法

作者:张峰伟; 陈兴蜀; 尹学渊; 刘莉伟数据挖掘粒子群算法数据预处理web使用挖掘

摘要:针对传统的Web使用挖掘数据清理方法不再适用于现有网络环境的现状,提出了一种Web使用挖掘数据清理方法。该方法提出以网络流量作为Web使用挖掘的数据来源,将数据清理的问题转变为对用户显式操作产生的HTTP会话的识别问题,使用二进制粒子群算法(BPSO)选出最能精确识别用户显式HTTP会话的特征子集,利用选择出的特征子集生成决策树对用户显式HTTP会话进行识别。实验结果表明:该方法能够准确、有效地识别出用户显式HTTP会话,对日志记录数的压缩率达到98.7%,能够完成数据清理的任务,为之后的数据挖掘提供有力的支持。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

工程科学与技术

《工程科学与技术》(双月刊)创刊于1957年,由中华人民共和国教育部主管,四川大学主办,CN刊号为:51-1773/TB,自创刊以来,颇受业界和广大读者的关注和好评。 《工程科学与技术》主要刊登水利与土木工程、化学与化学工程、材料科学与工程、机械工程、信息工程、电气工程、环境科学与工程、应用物理等工程学科方面研究、开发以及应用的有创造性的学术论文。优先刊登科学与技术领域中探索研究的新成果以及得到自然科学基金资助或重大攻关项目的科研成果。读者对象为高等院校理工类师生、科研人员和工程技术人员。 

杂志详情