作者:王晓伟 贾焰不确定数据层次索引skyline支配频率
摘要:由于在经济、军事等领域的广泛应用,不确定数据的查询处理技术成为近年来数据库领域的研究热点.概率top-k查询根据打分函数和概率两个维度来对数据进行排序,因此具有多种查询语义.作为I/O密集型查询,概率top-k查询需要具备一定通用性的索引技术来提高查询效率.本文从分析概率top-k查询满足的性质入手,分别基于skyline和支配频率的概念,提出两种层次索引.通过理论分析和实验证明了满足特定性质的概率top—k查询均可以利用这两种索引来提高L/O效率,其中基于支配频率的索引具有更好的鲁棒性.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社