大数定律与中心极限定理

随机变量序列的两种收敛性

依概率收敛：设\(\{X_n\}\)为一随机变量序列，\(X\)为一随机变量，若对于任意\(\epsilon>0\),有

\[P(|X_n-X|\geq\epsilon)\rightarrow0(n\rightarrow \infty) \]

则称序列\(\{X_n\}\)依概率收敛于\(X\)，记作\(X_n\xrightarrow[]{P}X\)

依概率收敛的性质：若

\[X_n\xrightarrow[]{P}a \]

\[Y_n\xrightarrow{P}b \]

则：

\[X_n\pm Y_n\xrightarrow[]{P}a\pm b \]

\[X_nY_n\xrightarrow[]{P}ab \]

\[X_n\div Y_n \xrightarrow[]{P}a\div b \]

弱收敛（按分布收敛）：随机变量\(X,X_1,X_2…\)的分布函数为\(F(x),F_1(x),F_2(x)…\)，若对于\(F(x)\)的任意一个连续点\(x\)，有

\[lim_{n\rightarrow\infty}F_n(x)=F(x) \]

则称分布函数序列\(\{F_n(x)\}\)弱收敛于\(F(x)\),记作

\[F_n(x)\xrightarrow{W}F(x) \]

也称\(\{X_n\}\)按分布收敛于\(X\),记作

\[X_n\xrightarrow{L}X \]

特征函数

特征函数：设\(X\)是一个随机变量，则

\[\varphi(t)=E(e^{itX}) \]

为X的特征函数。

常用分布的特征函数

0-1分布：\(\varphi(t)=pe^{it}+q\)
泊松分布:

\[\varphi(t)=\sum e^{itx}\frac{\lambda^ke^{-\lambda}}{k!}=e^{-\lambda}\sum\frac{(\lambda e^{it})^k}{k!}=e^{\lambda(e^{it}-1)} \]

均匀分布:

\[\varphi(t)=\int_a^b\frac{e^{itx}}{b-a}dx=\frac{e^{itb}-e^{ita}}{it(b-a)} \]

标准正态分布:

\[\varphi(t)=e^{-\frac 12 t^2} \]

证明：

\[\begin {split}\varphi(t)&=\int_{-\infty}^{\infty}e^{itx}\frac1{\sqrt{2\pi}}e^{-\frac 12x^2}dx \\&=\frac1{\sqrt{2\pi}}\int_{-\infty}^{\infty}\sum_{n=0}^{\infty}\frac {(itx)^n}{n!}e^{-\frac 12x^2}dx \\&=\sum_{n=0}^{\infty}\frac {(it)^n}{n!}[\int_{-\infty}^{\infty}x^n\frac1{\sqrt{2\pi}}e^{-\frac 12x^2}]dx \\&=\sum_{n=0}^{\infty}\frac {(it)^n}{n!}E(X^n)\end {split}\]

当n为奇数时，

\[E(X^n)=\int_{-\infty}^{\infty}x^n\frac1{\sqrt{2\pi}}e^{-\frac 12x^2}dx=0 \]

当n为偶数时，

\[\begin{split}E(X^n)=E(X^{2m}) &=\int_{-\infty}^{\infty}x^{2m}\frac1{\sqrt{2\pi}}e^{-\frac 12x^2}dx \\&=\frac1{\sqrt{2\pi}} \int_{-\infty}^{\infty}-x^{2m-1}d(e^{-\frac 12x^2}) \\&=\frac1{\sqrt{2\pi}}(2m-1) \int_{-\infty}^{\infty}x^{2m-2}e^{-\frac 12x^2}dx \\&= (2m-1)(2m-3)…1\int_{-\infty}^{\infty}\frac1{\sqrt{2\pi}}e^{-\frac 12x^2}dx \\&=(2m-1)!! \\&=\frac{2m!}{2^m(m-1)!} \end {split}\]

故

\[\begin{split}\varphi(t) &=\sum_{m=0}^{\infty}\frac {(it)^{2m}}{(2m)!}E(X^{2m}) \\&=\sum_{m=0}^{\infty}\frac {(it)^{2m}}{(2m)!}\frac{2m!}{2^m(m-1)!} \\&=\sum_{m=0}^{\infty}\frac{(-\frac{t^2}{2})^m}{m!} \\&=e^{-\frac 12t^2} \end{split}\]

指数分布的特征函数:

\[\varphi(t)=(1-\frac{it}\lambda)^{-1} \]

证明：

\[\begin{split} \varphi(t)&=\int_0^{\infty}e^{itx}\lambda e^{-\lambda x}dx \\&=\lambda[\int_0^{\infty}cos(tx)e^{-\lambda x}dx+i\int_0^{\infty}sin(tx)e^{-\lambda x}dx] \end{split}\]

\[\begin{split} I&=\int_0^{\infty}cos(tx)e^{-\lambda x}dx \\&=\int_0^{\infty}\frac 1te^{-\lambda x}dsin(tx) \\&=\frac \lambda t\int_0^{\infty}sin(tx)e^{-\lambda x}dx \\&=-\frac \lambda {t^2} [-1+\lambda \int_0^{\infty}cos(tx)e^{-\lambda x}dx] \\&=-\frac{\lambda^2}{t^2}I+\frac{\lambda}{t^2} \end{split}\]

故

\[I = \frac {\lambda}{\lambda^2+t^2} \]

\[\begin{split}\varphi(t)&=\lambda(\frac {\lambda}{\lambda^2+t^2}+i\frac {t}{\lambda^2+t^2}) \\&=\frac \lambda{\lambda^2+t^2}(\lambda+it) \\&=\frac \lambda{\lambda-it} \\&=(1-\frac{it}\lambda)^{-1} \end{split}\]

特征函数的性质

\(|\varphi(t)|\leq \varphi(0)=1\)

证明:

\[|\varphi(t)|=|\int e^{itx}f(x)dx|\leq\int|e^{itx}|f(x)dx=1 \]

若\(Y=aX+b\)，则

\[\varphi_Y(t)=e^{ibt}\varphi_X(at) \]

证明：

\[\varphi_Y(t)=\int e^{it(ax+b)}f(x)dx=e^{itb}\int e^{itax}f(x)dx=e^{ibt}\varphi_X(at) \]

若\(X\)和\(Y\)相互独立，则有

\[\varphi_{X+Y}(t)=\varphi_X(t)\varphi_Y(t) \]

证明：

\[E(e^{it(X+Y)})=E(e^{itx}e^{ity})=E(e^{itx})E(e^{ity})=\varphi_X(t)\varphi_Y(t) \]

若\(E(X^l)\)存在，则\(X\)的特征函数l次可导，且对\(1\leq k\leq l\)有

\[\varphi^{(k)} (0)=i^kE(X^k) \]

证明：

\[\varphi^{(k)}(t)=\int i^kx^ke^{ixt}f(x)dx \]

将\(t=0\)代入得

\[\varphi^{(k)}(0)=i^k\int x^kf(x)dx=i^kE(X^k) \]

大数定律

概率是频率的稳定值，其中稳定是什么意思？大数定律详细的描述了这个问题。

大数定律指的是随机变量序列的平均值，依概率收敛于各个随机变量均值的平均值。

伯努利大数定律

伯努利大数定律说明这样一个事实：对于一个服从伯努利分布的事件\(s_n\)，随着试验次数\(n\)的增加，事件发生的频率\(f=\frac{s_n}n\)与概率\(p\)的偏差的绝对值\(|\frac{s_n}n-p|\)大于给定精度\(\epsilon\)的概率越来越小，这就是概率是频率的稳定值的数学描述。即频率\(f\)是概率\(p\)的一个点估计量，且是无偏的。

伯努利大数定律:设\(s_n \sim B(n,p)\),则对于任意的\(\epsilon>0\),有

\[lim_{n\rightarrow\infty}P(|\frac{s_n}{n}-p|<\epsilon)=1 \]

证明：由于

\[s_n\sim B(n,p) \]

故

\[E(\frac{s_n}n)=\frac 1nE(s_n)=p \]

\[\sigma^2 = D(\frac {s_n}n)=\frac 1{n^2}D(s_n)=\frac{p(1-p)}{n} \]

切比雪夫不等式可知

\[P(|\frac{s_n}{n}-p|<\epsilon)\geq 1-\frac{\sigma^2}{\epsilon^2} \]

故

\[\begin{split}lim_{n\rightarrow\infty}P(|\frac{s_n}{n}-p|<\epsilon)\geq lim_{n\rightarrow\infty}(1-\frac {\sigma ^2}{\epsilon^2})=lim_{n\rightarrow\infty}[1-\frac{p(1-p)}{n\epsilon^2}]=1\end{split} \]

大数定律的一般形式

伯努利大数定律的研究对象其实是一个独立同分布的随机变量序列\(\{X_n\}\),其中\(X_i\)服从两点分布，伯努利大数定律可以看作从两点分布组成的序列中选出\(n\)项来，可改写为

\[{lim_{n\rightarrow \infty}P(|\frac 1n\sum_{i=1}^{n}X_i-\frac 1n\sum_{i=1}^{n}EX_i|<\epsilon)=1} \]

因此，服从以上表达式的任意随机变量序列均称为服从大数定律。

切比雪夫大数定律

切比雪夫大数定律：随机变量序列\(\{X_n\}\)中随机变量\(X_i\)两两不相关且方差存在，即\(DX_i\leq c\),则该随机变量序列服从大数定律。

证明：由于\(X_i\)两两不相关，故

\[\sigma^2=D(\frac 1n\sum X_i)=\frac 1{n^2}\sum DX_i\leq \frac cn \]

由切比雪夫不等式可得

\[P(|\frac 1n\sum_{i=1}^{n}X_i-\frac 1n\sum_{i=1}^{n}EX_i|<\epsilon|)\geq 1-\frac {\sigma^2}{\epsilon^2}\geq 1-\frac c{n\epsilon^2} \]

故有

\[{lim_{n\rightarrow \infty}P(|\frac 1n\sum_{i=1}^{n}X_i-\frac 1n\sum_{i=1}^{n}EX_i|<\epsilon)=1} \]

马尔可夫大数定律

马尔可夫条件:

\[lim_{n\rightarrow\infty}\frac {D(\sum X_i)}{n^2}=0 \]

满足马尔可夫条件的随机变量序列服从大数定律。

辛钦大数定律

辛钦大数定律：随机变序列\(\{X_n\}\)独立同分布且均值存在，方差不存在，则服从大数定律。

证明：我也不会。

中心极限定理

大数定律讨论的是在什么情况下，随机变量序列的算术平均依概率收敛于其均值的算术平均，中心极限定理讨论的是在什么条件下，独立随机变量和

\[Y_n = \sum_{i=1}^n X_i \]

收敛于正态分布。

独立同分布下的中心极限定理

林德伯格-莱维中心极限定理：设\(\{X_n\}\)是独立同分布的随机变量序列，\(EX_n=\mu\)，\(DX_n=\sigma^2\)，设

\[Y_n=\frac{\sum X_i-n\mu}{\sqrt n\sigma} \]

则当\(n\rightarrow\infty\)时，\(Y_n\)近似服从标准正态分布，即

\[lim_{n\rightarrow\infty}P(Y_n\leq y)=F_Y(y)=\frac 1{\sqrt {2\pi}}\int_{-\infty}^y e^{\frac{-t^2}2}dt \]

证明：要证原命题只需证\(Y_n\)的特征函数收敛于标准正态分布即可，设\(X-\mu\)的特征函数为\(\varphi(t)\)，则\(Y_n\)的特征函数为

\[\varphi_{Y_n}(t)=[\varphi(\frac t{\sqrt n \sigma})]^n \]

由于\(E(X-\mu)=0,E(X-\mu)^2=D(X-\mu)=\sigma^2\),故

\[\varphi'(0)=0,\varphi''(0)=-\sigma^2 \]

由泰勒公式，

\[\varphi(t)=\varphi(0)+\varphi'(0)t+\frac 12\varphi''(0)t^2+o(t^2) \]

故

\[lim_{n\rightarrow\infty}\varphi_ {Y_n}(t)=lim_{n\rightarrow\infty}(1-\frac 12\sigma^2\frac {t^2}{n\sigma^2})^n=e^{-\frac 12t^2} \]

原命题得证。

蒂莫弗-拉普拉斯中心极限定理

蒂莫弗-拉普拉斯中心极限定理：随机变量\(X\)为两点分布时的独立随机变量的中心极限定理。

独立不同分布下的中心极限定理

林德伯格中心极限定理
- 林德伯格条件:对于任意的\(\tau>0\)，有
\[lim_{n\rightarrow\infty}\frac 1{\sigma^2\tau^2}\sum_{i=1}{n}\int_{|x-\mu_i|>\tau\sigma}(x-\mu_i)^2f_i(x)dx=0 \]

满足林德伯格条件的独立随机变量序列有中心极限定理。

posted @ 2021-08-09 21:57 HH丶丶阅读(1060) 评论(0) 收藏举报

刷新页面返回顶部

madaha