HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于实体的文本数据与XML文档的匹配技术研究

作者:刘木强 杨卫东xml匹配技术实体抽取基于实体的最近语义片段ecsf

摘要:目前飞机企业等单位的大量数据采用XML格式存储,且与其它业务文本数据之间缺乏联系.在异构数据集成领域,文本数据与XML文档的模式匹配还较少有人关注.提出文本数据与XML文档的匹配方法,该匹配方法采用两阶段的算法,首先使用基于条件随机场的实体抽取算法从文本文档中提取实体信息,然后通过基于实体的最近语义片段(ECSF)检索算法在XML树中查询覆盖所有实体及实例的最近语义片段作为匹配对象.ECSF检索算法中基于实体的最近语义片段含义是XML树上的覆盖所有实体及实例信息的最小子树,且实例所对应的实体必须是该实例的祖先节点.最后通过实验验证了本文提出方法的可行性和有效性,且具有较好的匹配效果,包括召回率和准确率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

小型微型计算机系统

《小型微型计算机系统》(CN:21-1106/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《小型微型计算机系统》杂志刊登文章的内容涵盖计算技术的各个领域(计算数学除外)。包括计算机科学理论、体系结构、计算机软件、数据库、网络与通讯、人工智能、多媒体、计算机图形与图像、算法理论研究等各方面的学术论文。

杂志详情