作者:刘典型 钟钢特殊网页信息提取type干扰码脚本
摘要:在分析与总结前人对网页中文字的提取方法研究的基础上,针对采用脚本限制提取文字的特殊网页,作了深入的研究和分析,提出多种限制的解除方法,并实现了对干扰码的过滤,使特殊网页文本的提取成为可能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《中国科技信息》(CN:11-2739/N)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国科技信息》栏目有科技新闻、科技杂志要览、能源与环境、工程、农业、制造、交通运输、信息科技、现代服务、健康与生物医药、城镇化与城市发展、科技教育创新、基础及前沿研究、创新体系建设等。
部级期刊
人气 1075747 评论 53
省级期刊
人气 846892 评论 70
人气 808519 评论 68
人气 754365 评论 72