HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于coroutine模型的网络爬虫设计与实现

作者:仇晶; 丁任霜; 张光华; 张红斌coroutine爬虫多线程阻塞

摘要:网络爬虫在中文信息处理中被大量使用,根据待处理的问题定向爬取相关领域的数据,为后续中文信息处理提供基础.传统多线程模型在处理高并发和大量I/O阻塞操作时,存在较为明显的限制和不足.针对以上问题,提出了一种基于coroutine模型的解决方案.从coroutine的基本原理和实现方法上作了较为详细的阐述,并给出基于coroutine网络爬虫的完整实现.实验表明,该方案能够有效地降低系统负荷,提高爬虫的爬取效率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

河北师范大学学报·教育科学版

《河北师范大学学报·教育科学版》(CN:13-1286/G)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《河北师范大学学报·教育科学版》旨在反映自然科学各领域的重要研究成果和具有创新性的学术成果,促进 国内外学术交流。

杂志详情