差分隐私(二):差分隐私能够做什么
1、差分隐私数据库
只回答聚合查询的结果,向结果中添加噪声来满足差分隐私
例子:微软的PINQ、Uber的Chorus
技术难点:
(1) 如何用尽量少的噪声来完成差分隐私的目的,尤其是在查询需要连接多张数据库表的时候
(2) 如何高效计算查询的敏感度(度量一个函数或查询对个人数据的影响程度)
(3) 如何将差分一说你模块整合到现有数据库
2、差分隐私机器学习
在机器学习中引入噪声,使得算法生成的模型能满足差分隐私
例子:谷歌的TensorFlow Privacy、三星的Harmony算法
http://github.com/tensorflow/privacy
https://arxiv.org/abs/1606.05053?context=cs
3、差分隐私数据采集

场景:从移动设备采集用户数据,如应用程序的使用时长
为满足差分隐私,让用户采用类似随机化的方法来提供数据
技术难点:
需要采集的数据比较复杂,无法用传统的随机化回答解决
例子:谷歌的RAPPOR算法、苹果公司的CMS以及HCMS算法
RAPPOR: https://arxiv.org/abs/1407.6981v2
CMS&HCMS: https://machinelearning.apple.com/research/learning-with-privacy-at-scale
4、差分隐私的数据合成
基本原理:
(1)对源数据建模,得到一个统计模型
(2)用统计模型合成虚拟数据
例子:美国普查局的一些数据产品
http://onthemap.ces.census.gov/
技术难点
(1)找到一个合适的统计模型
(2)如何在统计模型中加入噪声来满足差分隐私