HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于DOM规范的网页分析技术研究

作者:林昌平; 郑皎凌页面结构分析dom深度优先遍历树型结构

摘要:基于DOM树模型进行网页建模,同时利用深度优先的递归算法对DOM树模型进行遍历.通过将HTML文档转换为DOM树,对其遍历后给树的节点唯一标号来对网页进行分析.为了更直观的分析网页结构还采用图形界面的形式来显示树型DOM文档.实验表明,提出的这种方法能够很好地分析Web页面标记的嵌套结构,并能准确地与转化成DOM树之后的嵌套结构相匹配,从而达到了精确的网页分析和网页节点定位的目的.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

成都信息工程学院学报

《成都信息工程学院学报》是一本有较高学术价值的双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《成都信息工程学院学报》是立足本校、面向国内外科技工作者的学术期刊。 重要通知:《成都信息工程学院学报》现已更名为《成都信息工程大学学报》。

杂志详情