作者:张啸剑; 陈莉; 金凯忠; 孟小峰高维数据差分隐私markov网联合树边缘分布
摘要:基于差分隐私的数据已得到研究者的广泛关注.然而,现有的方法却不能有效地处理高维数据,其原因在于维度灾难和值域多样会引入极大的噪音值,进而使得结果的可用性比较低.基于此,提出一种基于联合树的隐私高维数据方法PrivHD(differentially private high dimensional data release),该方法通过指数机制构造Markov网,引入满足差分隐私的高通滤波技术缩减指数机制搜索空间.结合充分三角化操作和顶点消除操作对Markov网分割来获得完全团图,采用最大生成树方法生成满足差分隐私的联合树.利用联合树中各个团后置处理之后的联合分布表合成最终的高维数据.基于真实的高维数据集比较PrivHD算法与PrivBayes(private Bayesian network),JTree(junction tree)算法的精度,实验结果表明:PrivHD算法的 k -way查询和SVM(support vector machine)分类精度优于同类算法.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社