No Free Lunch in Data Privacy

差分隐私性是在统计数据库上提供保密性噪声查询答案的有力工具。它保证了噪声查询答案的分布随任何元组的添加或删除而变化很小。它经常伴随着流行的说法,即它提供隐私,而不需要对数据进行任何假设,并且它可以防止知道除一条记录之外的所有记录的攻击者。本文对差别隐私进行了批判性分析。
首先,我们使用一个没有免费午餐定理来论证,如果不对数据是如何生成的做出假设,就不可能提供隐私和效用。然后我们解释哪里需要假设。我们认为,当可以限制攻击者对个人参与数据生成过程的推断时,个人的隐私就会得到保护。这与限制关于元组的存在的推断不同(例如,鲍勃在社交网络中的参与可能导致在他的朋友对之间形成边缘,从而其ff不仅影响被标记为“鲍勃”的元组)。(ff)反过来,参与证据的Definition取决于数据是如何产生的--这就是假设进入画面的方式。我们使用来自社会网络研究的例子以及先前发布的确定性统计数据的表格数据来解释这些想法。在这两种情况下,参与的概念各不相同,使用不同的隐私可能导致侵犯隐私,并且不同的隐私并不总是充分限制关于参与的推论。
1. INTRODUCTION
最近的研究表明,得到的查询答案可以实现对敏感数据集的非常准确的隐私保护统计分析[25,13,5,18]。有两种不同的隐私,我们称之为无界和有界(Unbound)和有界。

有界差分隐私因以下事实而得名:所有数据集D1、D2都具有固定大小n,而无界差分隐私没有这样的限制
关于差分隐私的隐私保障,还提出了更多的普及主张。这些措施包括:
·它没有对数据是如何生成的做出任何假设。
·它保护个人信息(即使攻击者知道数据中的所有其他个人)。
·它对任意的背景知识是健壮的。
这些都是对不同隐私提供的正式保证的松散尽管流行的解释。本文对不同隐私权的保障进行了批判性分析。这是DWork和NAOR[8,11]的一个不可能结果的重新表述、重新解释(通过去除对密码技术和相关复杂性的依赖,结果可通过更广泛的受众)。这表明,为了避免这种博弈论上的非隐私概念,对数据的假设是差分隐私所必需的。为了进行比较,我们提出了一种差分隐私的变体,它在没有假设的情况下保证了隐私,但提供的效用很小。
然后,我们认为,隐私保护的一个主要标准是:它是否可以隐藏个人参与数据生成过程的证据?(Definition)是否可以隐藏个人参与数据生成过程的证据?也就是说,它能限制攻击者推断个人参与的能力吗?参与证据的概念取决于数据是如何生成的,并且与元组的存在或不存在不同-例如,鲍勃对社交网络的参与可以导致在鲍勃的朋友对之间形成链接,因此参与ff不仅仅影响标记为“鲍勃”的元组。参与取决于数据是如何生成的,并且不同于元组的存在或不存在。
这种不同的隐私不需要对数据进行假设。
浙公网安备 33010602011771号