【常见分布及其特征(7)】马尔可夫不等式和切比雪夫不等式
马尔可夫不等式
- 引例:
已知某市级平均身高为1.6米,那么超过2米的人一定不会很多;(因为一旦多了,那么均值就不可能是1.6米了)那至多有多少呢?
问题中并未描述分布情况,但有以下条件,设随机变量XXX为班级人员的身高(X>0X>0X>0);则E(X)=1.6E(X)=1.6E(X)=1.6,求P(X>2)P(X>2)P(X>2);最极限的分布情况就是大部分人的身高都较高,但是存在极低的人拉低了平均身高才可以使期望E(X)=1.6E(X)=1.6E(X)=1.6;例如以下的这种极端情况
X1=2.1;X2=2.3;X3=0.4;P(X>2)=1/3X_1=2.1;\quad X_2=2.3;\quad X_3=0.4; \quad P(X>2)=1/3X1=2.1;X2=2.3;X3=0.4;P(X>2)=1/3
那么最极限情况下,P(X>2)P(X>2)P(X>2)是多少呢由期望定义可知;
E(X)=∫0∞xf(x)dx=∫02xf(x)dx+∫2∞xf(x)dx
\begin{align*}
E(X) &= \int_0^\infty xf(x) dx\\
&=\int_0^2xf(x) dx+\boxed{\int_2^\infty xf(x) dx}\\
\end{align*}
E(X)=∫0∞xf(x)dx=∫02xf(x)dx+∫2∞xf(x)dx
对于框出来的第二部分,xxx至少等于222,所以
∫2∞xf(x)dx≥∫2∞2f(x)dx=2∫2∞f(x)dx=2⋅P(X>2)
\int_2^\infty xf(x) dx\ge \int_2^\infty 2f(x) dx=2\int_2^\infty f(x) dx=2\cdot P(X>2)
∫2∞xf(x)dx≥∫2∞2f(x)dx=2∫2∞f(x)dx=2⋅P(X>2)
E(X)=∫02xf(x)dx+∫2∞xf(x)dx1.6≥∫02xf(x)dx+2⋅P(X>2)1.6≥2⋅P(X>2)P(X>2)≤0.8
\begin{align*}
E(X)&=\int_0^2xf(x) dx+\int_2^\infty xf(x) dx\\
1.6&\ge \int_0^2xf(x) dx+2\cdot P(X>2)\\
1.6&\ge 2\cdot P(X>2)\\
P(X>2)&\le 0.8
\end{align*}
E(X)1.61.6P(X>2)=∫02xf(x)dx+∫2∞xf(x)dx≥∫02xf(x)dx+2⋅P(X>2)≥2⋅P(X>2)≤0.8
- 一般形式
对于非负的的随机变量XXX,即X≥0X\ge 0X≥0,设期望为E(X)E(X)E(X),对于任意正数a>0a>0a>0,有马尔可夫不等式:
P(X≥a)≤E(X)a\boxed{P(X\ge a)\le \frac{E(X)}{a}}P(X≥a)≤aE(X)
证明法1:同引例;
E(X)=∫0∞xf(x)dxE(X)=∫0axf(x)dx+∫a∞xf(x)dxE(X)−∫0axf(x)dx=∫a∞xf(x)dx≥∫a∞af(x)dxE(X)−∫0axf(x)dx=∫a∞xf(x)dx≥a∫a∞f(x)dx=a⋅P(X≥a)又有:∫0axf(x)dx≥0E(X)≥a⋅P(X≥a)P(X≥a)≤E(X)a \begin{align*} E(X) &= \int_0^\infty xf(x) dx\\ E(X)&=\int_0^axf(x) dx+\int_a^\infty xf(x) dx\\ E(X)-\int_0^axf(x) dx&=\boxed{\int_a^\infty xf(x) dx} \ge \boxed{\int_a^\infty af(x) dx}\\ E(X)-\int_0^axf(x) dx&=\int_a^\infty xf(x) dx \ge a\int_a^\infty f(x) dx=\boxed{a\cdot P(X\ge a)}\\ 又有:\int_0^axf(x) dx&\ge0\\ E(X) &\ge a\cdot P(X\ge a)\\ P(X\ge a)&\le \frac{E(X)}{a} \end{align*} E(X)E(X)E(X)−∫0axf(x)dxE(X)−∫0axf(x)dx又有:∫0axf(x)dxE(X)P(X≥a)=∫0∞xf(x)dx=∫0axf(x)dx+∫a∞xf(x)dx=∫a∞xf(x)dx≥∫a∞af(x)dx=∫a∞xf(x)dx≥a∫a∞f(x)dx=a⋅P(X≥a)≥0≥a⋅P(X≥a)≤aE(X)
证明法2:
设随机变量YYY,当X≥aX\ge aX≥a时,Y=aY=aY=a,否则为0;即:
Y(X)={a,X≥a0,X<a Y(X)= \begin{cases} a,\quad X\ge a\\ 0,\quad X<a \end{cases} Y(X)={a,X≥a0,X<a
显然有:
E(X)≥E(Y)E(X)>a⋅P(X≥a)P(X≥a)≤E(X)a\begin{align*} E(X)&\ge E(Y)\\ E(X)&>a\cdot P(X\ge a)\\ P(X\ge a)&\le \frac{E(X)}{a} \end{align*} E(X)E(X)P(X≥a)≥E(Y)>a⋅P(X≥a)≤aE(X) - 描述
马尔可夫不等式(Markov’s Inequality)是概率论中的基础工具,用于估计非负随机变量超过某一阈值的概率上限。其核心思想是:
- 期望值与概率的关系:如果一个非负随机变量的期望值较小,那么它取值较大的概率也会较小。
- 例如平均身高比较低(例如1.5m),那么取值较大(例如2.1m)的概率也会比较小;
切比雪夫不等式
- 引例
已知某市人民平均身高为1.8米,标准差为0.05米,则身高大于2米的概率上限是多少(即无论服从何种分布)?
-
若忽略条件中的标准差条件
那么可以直接使用马尔可夫不等式来解决;
设随机变量XXX为班级人员的身高(X>0X>0X>0)
P(X≥a)≤E(X)aP(X≥2)≤1.82=0.9\begin{align*} P(X\ge a)&\le \frac{E(X)}{a}\\ P(X\ge 2)&\le \frac{1.8}{2}=0.9\\ \end{align*} P(X≥a)P(X≥2)≤aE(X)≤21.8=0.9
即无论身高是何种分布,身高大于2米的概率最高不会超过0.9;这显然是正确的,但是这个估计太过宽松了,实际意义并不大;但是如果限制了标准差(方差)呢?即数据的波动情况被限制了,至少对于无限制的情况,估计会更准确; -
考虑标准差限制的情况下
- 已知马尔可夫不等式以及方差和期望的关系如下,直接联立不等式:
{Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2P(X≥a)≤E(X)a \begin{cases} \text{Var}(X) = E[(X - E(X))^2]=E(X^2) - [E(X)]^2\\ P(X\ge a)\le \frac{E(X)}{a}\\ \end{cases} {Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2P(X≥a)≤aE(X)
由题意知:
Var(X)=E(X2)−[E(X)]20.052=E(X2)−1.82E(X2)=3.2425 \begin{align*} \text{Var}(X) &= E(X^2) - [E(X)]^2\\ 0.05^2&=E(X^2) - 1.8^2\\ E(X^2) &=3.2425 \end{align*} Var(X)0.052E(X2)=E(X2)−[E(X)]2=E(X2)−1.82=3.2425
令X→X2,a→4X\rightarrow X^2,a\rightarrow4X→X2,a→4代入马尔可夫不等式,则得:
P(X2≥4)≤E(X2)4 P(X^2\ge 4)\le \frac{E(X^2)}{4} P(X2≥4)≤4E(X2)
又X>0X>0X>0,所以P(X2≥4)=P(X≥2)P(X^2\ge 4)=P(X\ge2)P(X2≥4)=P(X≥2)
P(X≥2)≤E(X2)4P(X≥2)≤3.24254=0.810625 \begin{align*} P(X\ge 2)&\le \frac{E(X^2)}{4}\\ P(X\ge 2)&\le \frac{3.2425}{4}=0.810625 \end{align*} P(X≥2)P(X≥2)≤4E(X2)≤43.2425=0.810625
由上面的推论可得以下不等式
P(∣X∣≥a)≤[E(X)]2+Var(X)a2 \boxed{P(|X|\ge a)\le \frac{[E(X)]^2+\text{Var}(X)}{a^2}} P(∣X∣≥a)≤a2[E(X)]2+Var(X)
这样概率上限从0.9→0.8106250.9\rightarrow 0.8106250.9→0.810625,变得更小了,但是范围依旧太大 - 考虑方差的定义,将目标距离期望的偏差作为随机变量
为了写法统一,将方差(标准差)和期望:
Var(X)=σ,Var(X)=σ2,E(X)=μ \sqrt{\text{Var}(X)} = \sigma,\quad \text{Var}(X) = \sigma^2,\quad E(X)=\mu Var(X)=σ,Var(X)=σ2,E(X)=μ
方差(标准差)σ2\sigma^2σ2是随机变量XXX的取值和期望μ\muμ的差值的平均;那么这个偏差即为∣X−μ∣|X-\mu|∣X−μ∣,则应有马尔可夫不等式中的
P(X≥a)=P(∣X−μ∣≥∣a−μ∣)P(X≥a)=P((X−μ)2≥(a−μ)2) \begin{align*} P(X\ge a )&=P(|X-\mu|\ge|a-\mu|)\\ P(X\ge a )&=\boxed{P((X-\mu)^2\ge(a-\mu)^2)}\\ \end{align*} P(X≥a)P(X≥a)=P(∣X−μ∣≥∣a−μ∣)=P((X−μ)2≥(a−μ)2)
令左式的Y→(X−μ)2;(a−μ)→εY \rightarrow (X-\mu)^2;\quad (a-\mu)\rightarrow \varepsilonY→(X−μ)2;(a−μ)→ε,就是一个符合马尔可夫不等式的式子,直接代入:
P(Y≥ε2)≤E(Y)ε2P(Y≥ε2)≤E((X−μ)2)ε2 \begin{align*} P(Y\ge\varepsilon^2)&\le \frac{E(Y)}{\varepsilon^2}\\ P(Y\ge\varepsilon^2)&\le \frac{E((X-\mu)^2)}{\varepsilon^2}\\ \end{align*} P(Y≥ε2)P(Y≥ε2)≤ε2E(Y)≤ε2E((X−μ)2)
又有方差定义式:
Var(X)=E[(X−μ)2]=σ2 \text{Var}(X) = E[(X - \mu)^2] =\sigma^2\\ Var(X)=E[(X−μ)2]=σ2
故得:
P(Y≥ε2)≤σ2ε2 P(Y\ge\varepsilon^2)\le \frac{\sigma^2}{\varepsilon^2} P(Y≥ε2)≤ε2σ2
也可以写为:
P(X≥a)=P((X−μ)2≥ε2)≤σ2ε2 P(X\ge a )=P((X-\mu)^2\ge\varepsilon^2) \le \frac{\sigma^2}{\varepsilon^2} P(X≥a)=P((X−μ)2≥ε2)≤ε2σ2
取绝对值就是,切比雪夫不等式的一般形式
P(∣X−μ∣≥ε)≤σ2ε2 \boxed{P(|X-\mu|\ge\varepsilon) \le \frac{\sigma^2}{\varepsilon^2}} P(∣X−μ∣≥ε)≤ε2σ2
代入原题则有
P(∣X−1.8∣≥0.2)≤0.0520.22=0.0625\begin{align*} P(|X-1.8|&\ge 0.2)\le \frac{0.05^2}{0.2^2}=0.0625\\ \end{align*} P(∣X−1.8∣≥0.2)≤0.220.052=0.0625
这样概率上限从0.810625→0.06250.810625\rightarrow 0.06250.810625→0.0625,缩小了一个数量级;
- 已知马尔可夫不等式以及方差和期望的关系如下,直接联立不等式:
-
再次证明切比雪夫不等式
基于马尔可夫不等式:
X≥0且a>0;P(X≥a)≤E(X)aX\ge 0且a>0;\quad \boxed{P(X\ge a)\le \frac{E(X)}{a}}X≥0且a>0;P(X≥a)≤aE(X)
设随机变量YYY,有:
E(Y)=μ,Var(Y)=σ2E(Y)=\mu,\text{Var}(Y)=\sigma^2E(Y)=μ,Var(Y)=σ2
令X=(Y−μ)2,则X≥0X=(Y-\mu)^2,则X\ge0X=(Y−μ)2,则X≥0,那么对于任意的ε>0\varepsilon>0ε>0,有(同时平方);
P((Y−μ)2≥ε2)=P(∣Y−μ∣≥ε)P((Y-\mu)^2\ge \varepsilon^2)=P(|Y-\mu|\ge \varepsilon)P((Y−μ)2≥ε2)=P(∣Y−μ∣≥ε)
那么代入马尔可夫不等式:X=(Y−μ)2,a=ε2\boxed{X=(Y-\mu)^2,a=\varepsilon^2}X=(Y−μ)2,a=ε2,
P((Y−μ)2≥ε2)≤E((Y−μ)2)ε2P(∣Y−μ∣≥ε)≤E((Y−μ)2)ε2=σ2ε2P(∣Y−μ∣≥ε)≤σ2ε2 \begin{align*} P((Y-\mu)^2&\ge \varepsilon^2)\le \frac{E((Y-\mu)^2)}{\varepsilon^2}\\ P(|Y-\mu|&\ge \varepsilon)\le \frac{E((Y-\mu)^2)}{\varepsilon^2}=\frac{\sigma^2}{\varepsilon^2}\\ P(|Y-\mu|&\ge \varepsilon)\le \frac{\sigma^2}{\varepsilon^2}\\ \end{align*} P((Y−μ)2P(∣Y−μ∣P(∣Y−μ∣≥ε2)≤ε2E((Y−μ)2)≥ε)≤ε2E((Y−μ)2)=ε2σ2≥ε)≤ε2σ2
- 描述
切比雪夫不等式(Chebyshev’s Inequality)是概率论中的一个重要工具,用于估计任意随机变量偏离其期望值的概率上限。它的核心思想是:无论随机变量的分布形态如何,只要其方差存在,就可以量化其取值偏离均值的可能性。
实际与马尔可夫不等式区别,就是将直接求大于目标值aaa的概率上限,变更为偏差大于目标值偏差的概率上限ε=∣a−μ∣\varepsilon=|a-\mu|ε=∣a−μ∣;并且将单侧概率问题转化为对称的偏差问题;

浙公网安备 33010602011771号