数学-n个互相独立的连续随机变量中第i小的数值期望

提出问题

\(n\) 个互相独立的 \(0\)\(1\) 之间等概率生成的随机变量,求从小到大排序后第 \(i\) 个数的数值期望

一个简化的问题

我们先来求解一个简化的问题:最大值的数值期望是多少?

我们会发现,由于这些变量都是在 \(0\)\(1\) 之间等概率生成的,所以一个变量小于等于 \(x\) 的概率为 \(x\)(即 \(P(x_0\leq x)=x\)),则这 \(n\) 个数中最大值为 \(x\) 的概率为 \(x^{n-1}\)(其他 \(n-1\) 个变量都小于等于 \(x\)

再考虑到有 \(n\) 个数都有可能成为最大值,所以最后答案还要再乘\(\binom n1\)(实际上这个组合数应该放在原式的概率函数 \(p(x)\) 里的,但为了表达方便,我们将这个组合数提到最外面最后进行计算,后面的运算也是如此)

由于期望的计算公式为

\[E(x)=\sum_{k=1}^{+\infty}x_kp_k \]

套到这题里就是

\[\int_0^1x\cdot x^{n-1}\cdot \mathrm dx=\frac 1{n+1} \]

乘上组合数,得到这个简化问题的答案为 \(\frac n{n+1}\)

扩展

我们现在求得了最大值(第 \(n\) 个数)的数值期望为 \(\frac n{n+1}\),同理可以计算出最小数(第 \(1\) 个数)的数值期望为 \(\frac 1{n+1}\),由期望的线性性大胆猜想第 \(i\) 个数的数值期望为 \(\frac i{n+1}\)

下面来证明这个式子

类比上面求最大值的解法,我们可以很容易地列出我们需要的式子

\[\int_0^1x\cdot x^{i-1}\cdot (1-x)^{n-i}\cdot \mathrm dx=\int_0^1 x^i(1-x)^{n-i}\cdot \mathrm dx \]

(第 \(i\) 个数为 \(x\) 的概率为前 \(i-1\) 个数都小于等于 \(x\),后 \(n-i\) 个数都大于等于 \(x\),则概率为 \(x^{i-1}\cdot (1-x)^{n-i}\)

这个式子在最后还要乘一个 \(n\cdot \binom {n-1}{i-1}\)\(n\) 个数都有可能成为第 \(i\) 个数,还要再选出小于等于 \(x\)\(i-1\) 个数)

我们列出了式子,但这个式子并不像 \(x^n\) 这样好积分;为此,我们考虑分部积分:

\[\int_a^b uv'\mathrm dx=uv|_a^b-\int_a^b vu'\mathrm dx \]

积分

明确目标,我们要求

\[\int_0^1 x^i(1-x)^{n-i}\cdot \mathrm dx \]

\(\begin{cases}u=(1-x)^{n-i}\\v'=x^i\end{cases}\)

则原式即为

\[\int_0^1uv'\cdot \mathrm dx=(uv)\big|_0^1-\int_0^1 u'v\cdot \mathrm dx \]

由于 \(uv\)\(x=0\)\(1\) 时都为零,则只需要考虑后面的式子即可:

\[-\int_0^1 u'v\cdot \mathrm dx \\ =\int_0^1 (n-i)(1-x)^{n-i-1}\frac 1{i+1}x^{i+1}\cdot \mathrm dx \\ =\frac {n-i}{i+1}\cdot \int_0^1x^{i+1}(1-x)^{n-i-1}\cdot \mathrm dx\]

数列

发现这个式子和原式长得很像,可以对比一下:

\[\int_0^1 x^i\cdot (1-x)^{n-i}\cdot dx\\ \int_0^1x^{i+1}(1-x)^{n-i-1}\cdot dx \]

\(a_i=\int_0^1 x^i(1-x)^{n-i}\cdot \mathrm dx\),则可以得到一个有趣的递推式 \(a_i=\frac {n-i}{i+1}\cdot a_{i+1}\),而边界条件即为一开始证明的式子 \(a_n=\frac n{n+1}\)

从而可以得到 \(a_i\) 的通项公式 \(a_i=\frac {i!(n-i)!}{(n+1)!}\)

所以前面那一长溜的积分式,可以化简为 \(\frac {i!(n-i)!}{(n+1)!}\)

最后不要忘记之前提取出来的组合系数 \(n\cdot \binom {n-1}{i-1}\)

解得的答案为 \(\frac {i!(n-i)!}{(n+1)!}\cdot n\cdot \binom {n-1}{i-1}=\frac i{n+1}\)

猜想得证

结论

\(n\) 个互相独立的 \(0\)\(1\) 之间等概率生成的随机变量,求从小到大排序后第 \(i\) 个数的数值期望为 \(\frac i{n+1}\)

可以推广,若变量的生成范围为 \([l,r]\),则第 \(i\) 小数的数值期望为 \(l+\frac {i\cdot(r-l)}{n+1}\)

最近加了友链的一位同学知道一个比较简单的组合解释,果真还是老了啊

posted @ 2018-10-04 20:33  oier_hzy  阅读(...)  评论(...编辑  收藏