HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于C#+ScrapySharp+Selenium的数据采集技术研究

作者:叶文全scrapysharpselenium数据采集

摘要:ScrapySharp在HtmlAgilityPack类库的基础上进行了扩展,能够模拟Web浏览器操作,支持CSS选择器解析HTML节点,是基于.NET的数据采集框架。ScrapySharp高效、易用,但模拟浏览器的能力有限,而Selenium自动化测试框架具备强大的浏览器操作能力。通过对开发环境搭建、ScrapySharp与Selenium结合使用、JSON数据的采集方法、反反爬虫手段、数据批量存储等技术进行研究,得出一种基于C#+ScrapySharp+Selenium的数据采集解决方案。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

湖北第二师范学院学报

《湖北第二师范学院学报》(CN:42-1782/C)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《湖北第二师范学院学报》主要面向基础教育、高等师范教育,开展基础教育各学科及中小学师资培训、继续教育和高等师范各学科的研究,服务于地方教育、文化、经济,已逐步形成了自己的办刊特色。

杂志详情