时间相关性下的差异隐私量化

原文传送门【点击

  传统的差分隐私机制,假设数据是独立的,或者对手不了解数据相关性。但显示世界中连续的生成的数据倾向于在时间上相关,并且这种相关性可以由对手获取。本文研究在连续数据发布的背景下,事件相关性在传统差分隐私机制的潜在隐私损失

     首先,我们使用马尔可夫模型对时间相关性进行建模,并在对手了解此类时间相关性时分析DP机制的隐私泄漏我们的分析表明,DP机制的隐私丢失可能会随着时间的推移而累积并增加。我们称其为暂时性隐私泄漏。

    其次,为了测量这种隐私损失,我们设计了一种在多项式时间内进行计算的有效算法。尽管临时隐私泄漏可能会随着时间的推移而增加,但我们还表明,在某些情况下,其最高可能存在。

    第三,为了限制隐私丢失,我们提出了一种机制,可以将任何现有的DP机制转换为一种针对临时隐私泄露的机制。综合数据的实验证实了我们的方法是有效的。

 

本文贡献:

    1)定义时间相关性下的差分隐私泄露(TPL)。TPL包括向后隐私泄露(BPL)和前向隐私泄露(FPL)两部分,这是由于前向和后向时间相关的存在。我们的分析表明,BPL可能会由于以前的隐私泄漏而累积,而FPL会随着未来的发布而增加。直观地说,时间t的BPL受以前发布的数据的影响,时间t的FPL将受未来发布的影响。我们定义了时间相关下的α-差分隐私,表示为α- dpt,从而形式化了针对对手的DP机制的隐私保障,即时间隐私泄漏应以α为界。证明了α-DPT的一个新的序列合成定理(不同于-DP传统的序列合成)。

  2)其次,我们有效地计算了给定的前向和后向时间相关性下的时间隐私泄漏量。我们将时间隐私泄漏的计算转化为寻找线性分式规划问题的最优解。这类问题可以用指数时间内的单纯形算法求解。通过利用这些约束条件,我们提出了一个多项式时间算法来精确地量化时间隐私泄漏。

  3)第三,我们设计了私有数据释放算法,可以用来将传统的DP机制转换为满足α-DPT的机制。一个挑战是时间上的隐私泄露可能会随着时间的推移而增加,因此当释放时间T的长度是未知的时候,α-DPT是很难实现的。在我们的第一个解决方案中,我们证明了在某些情况下可能存在时间隐私泄漏的上限,在这些情况下,我们分配适当的隐私预算以确保无论T有多长,增加的时间隐私泄漏永远不会大于α。但是,当T太短时,时间隐私泄漏的积累会导致显著增加,我们可能会过度扰动数据。第二种解决方案是通过精细计算时间隐私泄漏量,精确实现每个时间点的α-DPT。

 

posted @ 2021-03-11 16:20  扑棱扑棱  阅读(228)  评论(0)    收藏  举报