
基于k-prototype聚类的差分隐私混合数据发布方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本研究提出了一种结合K-Prototype聚类算法与差分隐私技术的方法,旨在安全地发布包含分类和数值型变量的混合数据集。通过保护个体隐私的同时维持数据分析的有效性。
差分隐私是一种提供强大隐私保护的模型,在非交互框架下,数据管理者可以发布采用差分隐私技术处理的数据集供研究人员进行挖掘分析。然而,在数据发布过程中需要加入大量噪声,这会破坏数据可用性。因此,提出了一种基于k-prototype聚类的混合数据发布的差分隐私算法。
首先改进了k-prototype聚类算法,根据不同的数据类型分别采用不同的属性差异度计算方法来对数值型和分类型属性进行处理。这样可以将混合数据集中更可能相关的记录分组,并降低差分隐私敏感度;然后结合这些聚类中心值,使用差分隐私技术保护原始的数据记录:对于数值型属性应用Laplace机制,而对于分类型属性则采用指数机制。
从差分隐私的性质和组合特性两个方面对该算法进行了详细的分析与证明。实验结果表明,该方法能够显著提高数据发布的可用性。
全部评论 (0)
还没有任何评论哟~


