基于海量URL数据存取的快速文件系统设计分析

作者：卫锋刘烜苏庆华海量urlweb爬虫爬行策略系统构建系统模块

摘要：海量的URL快速文件系统建立的目标就是提供高速的处理机制,此时以高性能的web爬虫为基础的系统可以帮助实现这个目标。为了实现这个快速目标,URL往往将被保存在一个专业数据库中,但数据量的增加会给爬虫技术带来巨大的压力,关系数据库往往不能满足爬虫对海量URL的存储需求。本文所研究的是数据规模增加是如何打破web爬虫的技术瓶颈,从而使得系统获得更加优化的利用效果与速度的。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

信息通信

《信息通信》（CN：42-1739/TN）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《信息通信》1996年获邮电部科技期刊一等奖；1998年获全国优秀科技期刊三等奖；多次被评为湖北省优秀科技期刊。

杂志详情

服务推荐

信息通信相关期刊

基于海量URL数据存取的快速文件系统设计分析

服务推荐

在线咨询

杂志订阅

期刊推荐

现代经济信息

中国科技信息

通信世界

中国信息技术教育