HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于Hadoop平台的语义数据查询策略研究

作者:胡志刚; 景冬梅; 陈柏林; 杨柳并行处理语义信息查询策略mapreducesparql海量rdf

摘要:为了实现对海量RDF(resource description framework)数据的高效查询,研究了RDF三元组在分布式数据库HBase 中的存储方法,基于MapReduce 设计了海量RDF数据的两阶段查询策略,将查询分为SPARQL(simple protocol and RDF query language)预处理阶段与分布式查询执行阶段.SPARQL预处理阶段设计实现了基于SPARQL变量关联度的查询划分算法JOVR(joinonvariablerelation),通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序,根据连接变量将SPARQL子句连接操作划分到最小数量的Map-Reduce任务中;分布式查询执行阶段执行SPARQL预处理阶段划分的MapReduce任务,实现对海量RDF数据的并行查询.在LUBM标准测试数据集中的实验表明,JOVR算法能够高效地实现对海量RDF数据的查询,并具有良好的稳定性与可扩展性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机科学与探索

《计算机科学与探索》(CN:11-5602/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情