作者:王玉平 吴慧韫关联数web信息匮乏信息超载内容管理系统语义网络网络搜索工具资源描述框架http核心代码
摘要:目前互联网上信息呈爆炸式增长,为了找寻某项信息,我们需要借助搜索引擎(如Google、Bing等)来检索,即便如此,我们依然需要忍受信息浪费、信息超载带来的信息匮乏的困境。此外Web上的很多数据都不能互相操作。如果您想从一个网站抽取数据,与其他网站上的数据进行组合,您需要编写一个自定义爬虫(Crawler),从页面中抓取到所需要的信息后才能进行组合。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社