作者:徐东; 李贤; 张子迎; 孟宇龙; 冯光升信息安全隐私保护个性化聚类挖掘隐私度多视图
摘要:针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集。该算法在原始数据、隐私度、元组敏感度、隐私线序集等视图上进行多视图聚类,结合可变k-匿名策略提出面向多视图聚类的满足个性化需求的隐私保护算法,以对不同聚类簇以及同簇内部元组施加程度有别的个性化保护操作。该算法在一定程度上降低了隐私数据在聚类挖掘过程中泄漏的风险。实验结果表明该算法具有较低的信息损失和较好的运行效率,实验验证了所提算法的可行性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社