作者:卢中宁; 刘放美; 严宇辉xml密集型web数据数据抽取信息集成
摘要:针对密集型Web信息的数据抽取问题,提出了一种适合于XML结构又较为通用的树型结构抽取规则,把密集型Web上的数据抽取出来整合到指定模式的XML文档中.使用基于样例学习的半结构化Web信息抽取方法,自行开发了一个基于XML的Web新书查询原型系统,抽取Web页面效果良好,可直接应用于专门的Web网站信息的抽取,也可以用于其他相关应用的数据准备阶段.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《轻工学报》(CN:41-1437/TS)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《轻工学报》及时、准确报道我校和国内外科学技术成果,密切产、学、研,促使科技成果尽快转化为生产力,加速我国现代化步伐,以期达到本刊“传达科技信息,普及科技成果;发展科学技术,繁荣科技产业”的目的。
省级期刊
人气 238204 评论 36
人气 153990 评论 33
人气 151676 评论 53
人气 122598 评论 54