HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于预定义模式的Web网页结构化数据抽取

作者:王红卫; 马红; 张素智; 赵宇包装器数据抽取预定义模式

摘要:设计了一种基于预定义模式Web网页结构化数据抽取包装器软件.该软件利用最新Web技术、信息处理技术、人工智能技术对Web网页结构化信息解析,从非结构化的、不包括任何语义的HTML文档中抽取结构化语义数据.选取了几个出版社的新书Web页面进行了数据抽取验证和抽取结果分析.结果表明该软件可实现Web网页新书信息集成,并提供新书检索服务.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

轻工学报

《轻工学报》(CN:41-1437/TS)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《轻工学报》及时、准确报道我校和国内外科学技术成果,密切产、学、研,促使科技成果尽快转化为生产力,加速我国现代化步伐,以期达到本刊“传达科技信息,普及科技成果;发展科学技术,繁荣科技产业”的目的。

杂志详情