作者:郑剑 黄奚芳 刘聪分类树差分隐私保护集值型数据数据集特征
摘要:基于分类树划分的差分隐私方法能有效地对集值型数据的进行保护,但在构造分类树时该方法没有充分利用集值型数据集自身的特征。通过对添加噪声量的影响因素分析,提出了一种基于数据集特征的集值型数据方法,该方法首先对数据集进行分析,然后根据数据集中记录的种类数占总输出域的比例以及只出现一次的记录种类数占总输出域比例,动态构造分类树。实验结果表明:当数据集满足IOR≤40%且SIOR=(5%,20%]时,通过有效利用集值型数据集的特征,构造较优的分类树,可以添加少于10%的噪声。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社