作者:印莹; 赵宇海; 张斌数据仓库前缀冗余dwarf增量更新增量更新算法数据立方压缩存储更新过程实例化发生变化
摘要:数据立方计算是代价非常大的操作,并且被广泛研究.受空间的限制,存储一个完全实例化的数据立方是不可行的.最近提出的一种语义压缩数据立方-Dwarf,通过消除前缀冗余和后缀冗余把一个完全实例化的数据立方压缩存储到一个很小的空间.然而,当数据源发生变化时,它的更新过程是很复杂的.本文通过研究Dwarf在更新过程中汇总结点的变化特性,提出了一种基于Dwarf的新的增量更新算法,既能完全实例化数据立方又不需要重新计算,大大提高了数据立方的更新效率.实验进一步证明了该算法的效率和有效性,尤其适合数据仓库中的高维数据集.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社