HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

Web信息采集中页面分块技术的研究

作者:徐薇信息采集网页分块噪音

摘要:本文提出了一个基于网页分块的信息采集系统模型。在页面分析阶段,引入了改进的基于视觉的页面分块方法,这是一种自顶向下的、标签树独立的方法,其目的是检测出Web内容结构,实验结果令人满意。基于分块后的页面,利用一个经验交互式的噪音去除算法Page_CN,定义页面的噪音区间,去除噪音区域,得到更加明确的主题区域。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉纺织大学学报

《武汉纺织大学学报》(双月刊)结合学校办学特点和学科优势,在自然科学类的文章中,强调纺织特色,创刊于1988年,由湖北省教育厅主管,武汉纺织大学主办,CN刊号为:42-1818/Z,自创刊以来,颇受业界和广大读者的关注和好评。

杂志详情