作者:肖毅 张林 聂笑一数据挖掘web爬虫挖掘技术
摘要:从介绍Web挖掘与数据挖掘的差异入手,分析Web挖掘中Web爬虫的必要性和现代Web挖掘技术的发展方向,在深入了解Web爬虫的原理及其功能的基础上,提出一个现代网站通用的挖掘模型,并利用该模型设计一种网络爬虫.经实例证明,该爬虫能高效爬取更多的各种页面数据.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机系统应用》(CN:11-2854/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
部级期刊
人气 230030 评论 65
人气 214412 评论 35
省级期刊
人气 212790 评论 71
北大期刊、统计源期刊
人气 192914 评论 73