作者:朱梦麟; 李光耀; 周毅敏信息抽取相似页面树比较抽取规则
摘要:为了从具有海量信息的Internet上自动抽取Web页面的信息,提出了一种基于树比较的Web页面主题信息抽取方法。通过目标页面与其相似页面所构建的树之间的比较,简化了目标页面,并在此基础上生成抽取规则,完成了页面主题信息的抽取。对国内主要的一些网站页面进行的抽取检测表明,该方法可以准确、有效地抽取Web页面的主题信息。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《信息技术与网络安全》(CN:10-1543/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息技术与网络安全》现已更名为《网络安全与数据治理》。
部级期刊
人气 52926
人气 34009 评论 12
人气 8708 评论 14
省级期刊
人气 5643 评论 10