Hoeffding 不等式
拉拉玛玛卡卡与 Hoeffding 不等式
一天,拉拉玛玛卡卡在X 岛上跑团,他很好奇 \(\text{po}\) 给的技能要如何组合才是最强的,于是他花了 \(114514\) 秒写了一个程序来模拟不同组合的对战。
我们形式化一下问题:有一个随机变量 \(X\in\{0,1\}\),并且 \(\mathbb{E}(X)=p\) 存在。现在我们进行了 \(n\) 次实验,得到了 \(m\) 次为 \(1\),于是我们认为 \(\hat{p}=\frac{m}{n}\approx p\) 可以表示期望胜率(也就是 \(\mathbb{E}(X)\))。
于是拉拉玛玛卡卡跑了 \(\text{1e6}\) 次模拟,很高兴地得到了自己的胜率,但是他又跑了一次同样的程序,发现虽然十分位和百分位没变,但是千分位变化了。朴素的直觉告诉他前两位是非常可信的,但是千分位的结果就不足为外人道了。但是这个过程没有数学的支持还是让人害怕的,而且拉拉玛玛卡卡跑更多的模拟会让电脑非常卡,于是他想说服自己这个精度是足够的。
严格一点说,我们希望求出 \(\mathbf{P}(|\hat{p}-p|\le\epsilon)\) 的一个比较小的上界(当然也是比较紧的)。
现在我们假设 \(n\) 次模拟的结果为 \(X_1,X_2,X_3\ldots X_n\in\{0,1\}\),那么
我们期望 \(\mathbf{P}(|\hat{p}-p|\le\epsilon)\) 非常接近 \(1\),等价的,\(\mathbf{P}(|\hat{p}-p|\ge\epsilon)\) 应该非常接近 \(0\)。
假设未定义处概率为 \(0\),对于任意随机变量 \(X\in\mathbb{R}^{\ge0}\),我们显然有
于是我们可以得到 \(\mathbf{P}(X\ge a)\) 和 \(\mathbb{E}(X)\) 之间的关系。直接用一下
这时候,我们就发现事情不对劲了,因为这个式子里面没有 \(n\),而 \(\epsilon\) 又应该很小,那肯定就 \(O(\text{松松松})\) 了。一个 \(\text{naive}\) 的尝试是考虑 \(\mathbf{P}(|\hat{p}-p|\ge\epsilon)=\mathbf{P}(n|\hat{p}-p|\ge n\epsilon)\),但是这里的 \(n\) 之后会被提取出来约掉。
于是一个技巧性比较强的想法就是考虑
然后我们直接用刚才的不等式(其实是 \(\text{Markov}\) 不等式)
这里这个绝对值很难处理,所以就没了。
重活一世,我们一开始就考虑
分别计算 \(A,B\) 的结果就好了。我们先看 \(A\):
直接估计 \(\mathbb{E}(X_i-p)\) 是 \(0\),得直接估计 \(\mathbb{E}(e^{X_i-p})\)。这里直接用一个割线放缩 \(e^x\le 1+(e-1)x,x\in[0,1]\),然后就得到
到这里简直就是一道简单的高中导数题,因为有 \(p\in[0,1]\),于是求导就完了。然后我们发现有一个拐点 \(p=\frac{e-2}{e-1}\),这里的值比 \(1\) 大。
然后拉拉玛玛卡卡就又完蛋了,上界 \(e^{(1+a)^n-n\epsilon}\) 甚至超出了 EXPTIME class!
这个时候,他的同学告诉他,有个神奇的东西叫做 \(\text{Hoeffding}\) 不等式。拉拉玛玛卡卡一看,发现原来第一步需要引入一个参数来控制误差,也就是估计
这样到最后需要估计的是
我们还是对 \(p\in[0,1]\) 进行控制,求导就可以知道(或者可以直接看出来),\(f^{\prime\prime}(p)\le 0\)。(一个 \(\text{trick}\) 是先取对数,不过差不太多)
经过并不困难的计算(这一定在一位正常高中生的水平范围内),我们得到 \(f(p)\le e^{\frac{t^2}8}\)。
把这个结果带回对 \(A\) 的估计,就得到
使用初中生也能知道的二次函数相关的知识,我们可以知道右边在 \(t=4\epsilon\) 的时候取得最小值,也就是最紧的界。
然后对于 \(B\),过程是差不多的,得到的界是一样的。
于是我们得到 \(\mathbf{P}(|\hat{p}-p|\ge\epsilon)\le 2e^{-2n\epsilon}\),这就是 \(\text{Hoeffding}\) 不等式。(虽然我们一直在 \(X\in\{0,1\}\) 的特殊情况下跑,但是这个证明对更一般的情况也是适用的)
再付出一点微小的努力,我们就可以求出,假设我们需要 \(1-\delta\) 的置信度 \(|\hat{p}-p|\le\epsilon\),那么
就这样,拉拉玛玛卡卡可以放心地公布自己的模拟结果了。

浙公网安备 33010602011771号