作者:张腾飞; 张谦; 刘嘉勇规则过滤机器学习算法url分类
摘要:为实现根据HTTP 协议数据流对用户的行为进行分析,需要快速区分出用户访问 资源的URL .为此文章提出-种结合规则过滤和机器学习算法的方法,用于快速识别用户访 问的URL .首先将解析后的数据包根据URL 后缀过滤掉资源加载类的数据包,然后根据浏览 器 UserAgent的特有字段和在浏览器上访问网页的特性识别出浏览器UserAgent,最后通过基于 AdaBoost和 Bayse算法训练好的分类器识别出用户访问URL .实验结果表明,本文方法能够在 局域网数据流中高效、准确的识别出用户访问的URL .
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社