摘要: L4-Intro to Differential Privacy 拉普拉斯机制(Laplace Mechanism) 上一节课中,我们讨论了随机响应,这是一种适合于单个位的隐私化。这种算法一般来说并不直接也误差较大。今日所关注的是拉普拉斯机制,可以直接应用于任意一种类型的数字查询。在引入拉普拉斯机制 阅读全文
posted @ 2021-03-07 21:15 Uzuki 阅读(499) 评论(0) 推荐(0) 编辑
摘要: L3-Intro to Differential Privacy 从这节课开始就要介绍差分隐私算法了。 随机响应(Randomized Response) 场景提出 假若你是某一门课的教授,你希望统计一门课有多少学生作弊。显然你通过直接的问卷派发手段,学生不太可能会老老实实地上交真实答案。为此我们需 阅读全文
posted @ 2021-03-07 21:09 Uzuki 阅读(412) 评论(0) 推荐(0) 编辑
摘要: L2-Reconstruction Attacks 本节课的目的在于正式地讨论隐私,但是我们不讨论算法本身有多隐私,取而代之去讨论一个算法隐私性有多么的不可靠。并且聚焦于 Dinur 与 Nissim 在论文所提出的一些启发差分隐私的理论。 同时,我们会重点分析一种称为重构攻击(Reconstruc 阅读全文
posted @ 2021-03-07 21:05 Uzuki 阅读(1031) 评论(0) 推荐(0) 编辑
摘要: L1-Some Attempts at Data Privacy 本随笔基于Gautam Kamath教授的系列课程:CS 860 - Algorithms for Private Data Analysis - Fall 2020 本课的目的在于介绍一些信息加密的失败案例,介绍一些数据隐私安全的基 阅读全文
posted @ 2021-03-07 21:02 Uzuki 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 最近有关于图形学的授课,教授开始布置的上机打码的代码实现作业了。虽说教授为了让我们省心,直接就整了个环境已经配置好的几个G的虚拟机给我们用。但是你也懂的,虚拟机打码,卡得要命。一开始还以为会用到什么高级的库,看了下就是个Eigen3和Opencv,对于Opencv,感觉自己手动在本地配一个就OK了。在配置的过程中才发现这玩意坑是尼玛的多,而且还是不带附加件的情况下,因此本篇博客应然而生。 阅读全文
posted @ 2021-01-31 14:06 Uzuki 阅读(501) 评论(0) 推荐(1) 编辑
摘要: 8-探索与开发(Exploration and Exploitation) 1.导论 探索与开发二难问题 基于决策的决策过程存在以下两种选择 开发:基于目前的学习做最优的决策 探索:获取更多的学习 最佳的长期策略或许会包含一些短期的牺牲 获取足够的信息更能得到最为全面的决策 探索的方案(Approa 阅读全文
posted @ 2021-01-17 20:24 Uzuki 阅读(1519) 评论(0) 推荐(1) 编辑
摘要: 7-融合学习与规划(Integrating Learning and Planning) 1.导论 基于模型的强化学习(Model-Based Reinforcement Learning) 在上一个课程中,是从记录序列中直接学习策略的 在过往的课程中,是从记录序列中直接学习价值函数的 而本次课程, 阅读全文
posted @ 2021-01-17 20:13 Uzuki 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 6-策略梯度方法(Policy Gradient Method) 策略梯度概论(Introduction) 基于策略(Policy-Based) 的强化学习 对于上一节课(价值函数拟合)中采用参数$\theta$来估计价值和动作-价值函数 \[ \begin{align} V_\theta(S) & 阅读全文
posted @ 2021-01-17 20:10 Uzuki 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 价值函数拟合(Value Function Approximation) 导论(Introduction) 目前的价值函数都是基于打表法(lookup table)进行穷举 对于所有状态$s$都有一个实体$V(s)$去表示 或者对于每个状态-价值函数对$s,a$都有一个实体$Q(s,a)$去表示 对 阅读全文
posted @ 2021-01-17 19:55 Uzuki 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 无模型控制(Model-Free Control) 无模型预测概论 上一节课: 无模型预测 用于估计一个未知马尔科夫决策过程的价值函数 这节课 无模型控制 最优化一个未知马尔科夫决策过程的价值函数 一般在以下两种情况采用无模型预测 马尔科夫决策过程是未知的,仅能通过采用得到记录 马尔科夫决策过程是已 阅读全文
posted @ 2021-01-17 19:47 Uzuki 阅读(186) 评论(0) 推荐(0) 编辑