HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于XML的Web数据抽取方法的研究

作者:尚福华; 孙丽kddkdw半结构化xmlxsldom数据抽取web挖掘

摘要:针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法.由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web数据存储的问题,从而将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取.由于Web数据的大量信息都与抽取无关,所以利用XSL过滤掉XML的无关数据,并进行实时抽取,最后将合并结果保存到XML文档中.实验结果表明,此方法可以很好地解决Web数据的抽取和存储问题.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

黑龙江工程学院学报

《黑龙江工程学院学报》(双月刊)创刊于1987年,由黑龙江省教育厅主管,黑龙江工程学院主办,CN刊号为:23-1498/N,自创刊以来,颇受业界和广大读者的关注和好评。 《黑龙江工程学院学报》主要发表土木与建筑、测绘、交通运输、机械、经济与管理、计算机、电气信息与自动化、仪器仪表、材料、艺术、语言文学、数学、社会工作、思想政治工作以及高等教育研究与管理等相关基础理论研究和应用研究方面的学术论文。

杂志详情