差分隐私(二):差分隐私能够做什么

1、差分隐私数据库

 

只回答聚合查询的结果,向结果中添加噪声来满足差分隐私

例子:微软的PINQ、Uber的Chorus

技术难点:

(1) 如何用尽量少的噪声来完成差分隐私的目的,尤其是在查询需要连接多张数据库表的时候

(2) 如何高效计算查询的敏感度(度量一个函数或查询对个人数据的影响程度)

(3) 如何将差分一说你模块整合到现有数据库

 

2、差分隐私机器学习

 

 在机器学习中引入噪声,使得算法生成的模型能满足差分隐私

例子:谷歌的TensorFlow Privacy、三星的Harmony算法

http://github.com/tensorflow/privacy

https://arxiv.org/abs/1606.05053?context=cs

 

3、差分隐私数据采集

 
 场景:从移动设备采集用户数据,如应用程序的使用时长

 

 为满足差分隐私,让用户采用类似随机化的方法来提供数据

技术难点:

  需要采集的数据比较复杂,无法用传统的随机化回答解决

例子:谷歌的RAPPOR算法、苹果公司的CMS以及HCMS算法

RAPPOR: https://arxiv.org/abs/1407.6981v2

CMS&HCMS: https://machinelearning.apple.com/research/learning-with-privacy-at-scale

 

4、差分隐私的数据合成

 

  基本原理:

(1)对源数据建模,得到一个统计模型

(2)用统计模型合成虚拟数据

例子:美国普查局的一些数据产品

http://onthemap.ces.census.gov/

 

技术难点

(1)找到一个合适的统计模型

(2)如何在统计模型中加入噪声来满足差分隐私

 

posted @ 2023-06-24 15:25  sftsgly  阅读(567)  评论(0)    收藏  举报