作者:林昌平; 郑皎凌页面结构分析dom深度优先遍历树型结构
摘要:基于DOM树模型进行网页建模,同时利用深度优先的递归算法对DOM树模型进行遍历.通过将HTML文档转换为DOM树,对其遍历后给树的节点唯一标号来对网页进行分析.为了更直观的分析网页结构还采用图形界面的形式来显示树型DOM文档.实验表明,提出的这种方法能够很好地分析Web页面标记的嵌套结构,并能准确地与转化成DOM树之后的嵌套结构相匹配,从而达到了精确的网页分析和网页节点定位的目的.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《成都信息工程学院学报》是一本有较高学术价值的双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《成都信息工程学院学报》是立足本校、面向国内外科技工作者的学术期刊。 重要通知:《成都信息工程学院学报》现已更名为《成都信息工程大学学报》。
杂志详情