作者:王红卫; 马红; 张素智; 赵宇包装器数据抽取预定义模式
摘要:设计了一种基于预定义模式Web网页结构化数据抽取包装器软件.该软件利用最新Web技术、信息处理技术、人工智能技术对Web网页结构化信息解析,从非结构化的、不包括任何语义的HTML文档中抽取结构化语义数据.选取了几个出版社的新书Web页面进行了数据抽取验证和抽取结果分析.结果表明该软件可实现Web网页新书信息集成,并提供新书检索服务.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《轻工学报》(CN:41-1437/TS)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《轻工学报》及时、准确报道我校和国内外科学技术成果,密切产、学、研,促使科技成果尽快转化为生产力,加速我国现代化步伐,以期达到本刊“传达科技信息,普及科技成果;发展科学技术,繁荣科技产业”的目的。
省级期刊
人气 238204 评论 36
人气 153990 评论 33
人气 151676 评论 53
人气 122598 评论 54