概率论复习笔记

$X$代表随机变量,$x$是具体的值。

规定:连续型随机变量取任意指定值的概率为$0$,即:$P(X=a)=0$

 

$D(aX+b)=a^2D(X)$

$E(aX+b)=aE(X)$

无论$X、Y$是否相互独立,都有$E(X+Y)=E(X)+E(Y)$

当相互独立时,有$E(XY)=E(X)E(Y)$

当相互独立时,有$D(X\pm Y)=D(X)+D(Y)$,可以通过$D(aX+ bY+c)=a^2D(X)+b^2D(Y)+2abCov(X,Y)$,而$Cov(X,Y)=\rho_{XY}\sqrt{D(X)D(Y)}$,而$\rho_{XY}=0$得到。

 

随便推几个式子。

总体服从$N(\mu,\sigma^2)$,即对任意$X_i \sim N(\mu,\sigma^2)$ 。那么根据中心极限定理$\sum_\limits{i=1}^{n} X_i \sim N(n\mu,n\sigma^2)$,于是$\overline{X}=\frac{\sum_\limits{i=1}^{n}X_i}{n}\sim N(\mu,\frac{\sigma^2}{n})$。

1.$\frac{1}{\sigma^2}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 = \frac{1}{\sigma^2}\sum\limits_{i=1}^{n}N^2(0,\frac{n-1}{n}\sigma^2) = \frac{1}{\sigma^2}\sum\limits_{i=1}^{n}( \sqrt{{\frac{n-1}{n}}}\sigma N(0,1))^2$

$=\frac{n-1}{n}\sum\limits_{i=1}^{n} N^2(0,1)=\frac{n-1}{n}N^2(0,n)=N^2(0,n-1)=\sum\limits_{i=1}^{n-1}N^2(0,1)\sim \chi^2(n-1)$

2.于是$\frac{1}{\sigma^2}\sum\limits_{i=1}^{n} (X_i-\mu)^2= \frac{1}{\sigma^2}\sum\limits_{i=1}^{n} N^2(0,\sigma^2) = \sum\limits_{i=1}^{n} N^2(0,1)  \sim \chi^2(n)$

3.$\frac{n (\overline{X}-\mu)^2}{\sigma^2} = \frac{n N^2(0,\frac{\sigma^2}{n})}{\sigma^2}=\frac{n (\frac{\sigma}{\sqrt{n}} N(0,1))^2}{\sigma^2}=N^2(0,1)\sim \chi^2(1)$

4.$\frac{(n-1)S^2}{\sigma^2}= \frac{1}{\sigma^2}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 \sim \chi^2(n-1)$

5.$\frac{\sqrt{n} (\overline{X}-\mu)}{S} = \frac{N(0,\sigma^2)}{\sqrt{\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2}} = \frac{N(0,\sigma^2)}{\sqrt{\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2}}=\frac{N(0,\sigma^2)}{\sqrt{\frac{1}{n-1}\sigma^2 \sum\limits_{i=1}^{n} N^2(0,\frac{n-1}{n})}}=\frac{N(0,1)}{\sqrt{\frac{1}{n-1}  N^2(0,n-1)}}$

$=\frac{N(0,1)}{\sqrt{\frac{1}{n-1} \sum\limits_{i=1}^{n-1} N^2(0,1)}}\sim t(n-1)$

 

全概率公式和贝叶斯公式

设$B$是$A$的一个划分。

$P(A)=P(AB_1 \cup A B_2 \cup ...\cup AB_n)=P(AB_1)+...+P(AB_n)$

$=P(A|B_1)P(B_1)+...+P(A|B_n)P(B_n)$

贝叶斯公式

$P(B_1|A)=\frac{P(AB_1)}{P(A)}=\frac{P(B_1)P(A|B_1)}{全概率公式}$

 

概率密度函数$f(x)$

某个邻域内概率的变化快慢。概率密度函数的值是概率的变化率,概率密度函数的面积才是概率。

于是可以得知$(a,b]$的概率:$P(a<X\le b)=\int_a^bf(x)dx$

性质:$f(x)\ge 0$ ,$\int_{-\infty}^{\infty}f(x)dx=1$。这两点是判断$f(x)$是否是概率密度函数的充要条件。

 

已知$X$的概率密度函数。

$Y=G(X)$

$F_Y(y)=P\{Y\le y\}=P\{G(X)\le y\}=P\{G^{-1}(G(X))\le G^{-1}(y) \}=P\{X\le G^{-1}(y) \}$

$=\int_{-\infty}^{G^{-1}(y)}f_X(x)dx$

根据$x$的分段点,给$y$做对应的分类讨论即可。

 

概率分布函数$F(x)$

是$X$取$\le x$的概率之和,故又称概率累积概率函数。

于是可以得知$(a,b]$的概率:$P(a<X\le b)=F(b)-F(a)$

 

两者的联系

$F(x)=\int_{-\infty}^{\infty}f(t)dt$

$f(x)=F'(x)$

 

由密度函数$f$求分布函数$F$

$F(x),$ $F_X(x)$,$X$的分布函数,$P\{X\le x\}$都是同一概念。

一维

$f(x)=\begin{cases} 0, x\le 0\\e^{-x},x>0 \end{cases}$

已知$Y=\begin{cases} 2,X\le 1\\X,X>1  \end{cases}$,求$F(y)$

$F(y)=P(Y\le y)=P(2\le y,X\le 1)+P(X \le y,X>1)$

$=\begin{cases} \int_{-\infty}^{1}f(x)dx,y\ge2\\0,y<2 \end{cases}+\begin{cases}\int_{1}^{y}f(x)dx,y\ge1\\0,y<1 \end{cases}$

$=\begin{cases} 1-e^{-1},y\ge2\\0,y<2 \end{cases}+\begin{cases} e^{-1}-e^{-y},y\ge1\\0,y<1 \end{cases}$

$=\begin{cases} 0,y<1 \\e^{-1}-e^{-y},1\le y<2\\1-e^{-y},y\ge 2 \end{cases}$

 

二维连续型求概率,求$(X,Y)$的联合分布函数,求$F(x,y)$,求$P\{X\le x,Y\le y \}$是同一概念。

二维:

例1.

$f(x,y)=\begin{cases} 2-x-y, \;\;0<x<1,0<y<1\\0,其他 \end{cases}$

求$P\{X>2Y\}$

$P\{X>2Y\}=\iint\limits_{D}(2-x-y)dxdy$

$D$是满足条件的区域即$Y\le\frac{X}{2}$与$f(x,y)$非零区域的交集。

画图可知,结果为$\iint\limits_{D}(2-x-y)dxdy=\int_0^{1}dx\int_0^{\frac{x}{2}}(2-x-y)dy=\frac{7}{24}$

例2.

$f(x,y)=\begin{cases} x+y, \;\;0<x<1,0<y<1\\0,其他 \end{cases}$

求$P\{X\le x,Y\le y\}$

$\iint\limits_{D}(x+y)dxdy=\begin{cases} \frac{x^2y}{2}+\frac{xy^2}{2} ,\;0< x<1,0<y<1 \\ \frac{x^2}{2}+\frac{x}{2},\;0<x<1,y\ge1 \\ 1,\;x\ge1,y\ge1 \\ \frac{y}{2}+\frac{y^2}{2}   ,\; x\ge1,0<y<1 \\0,其他   \end{cases}$

 

 

由分布函数$F$求密度函数$f$

一维:求导

二维:求$x$和$y$的混合偏导

 

 

由密度函数$f$求另一个密度函数$f$

一维

先求$F$,然后再求导得$f$。

例1.

$f(x)=\begin{cases} 0, x\le 0\\e^{-x},x>0 \end{cases}$

已知$Y=2X$,求$f_Y(y)$。

$F(y)=P\{Y\le y \}=P\{2X\le y\}=P\{X \le \frac{y}{2}\}$

当$y\le 0$,$F(y)=0$;当$y >0$,$F(y)=\int _0^{\frac{y}{2}}e^{-x}dx=1-e^{-\frac{y}{2}}$

$f(y)=\begin{cases} \frac{1}{2}e^{-\frac{y}{2}},y>0\\0,y\le 0 \end{cases}$

 

二维

先求$F$,然后再求导得$f$。

例1.

$f(x,y)=\begin{cases} 2e^{-(x+2y)} ,\;\;x>0,y>0  \\0,其他 \end{cases}$

已知$Z=X+2Y$,求$f_Z(z)$

$F(z)=P\{Z\le z\}=P\{X+2Y\le z \}$

$Y\le \frac{z}{2}-\frac{X}{2}$,画图可知,当$z\le 0$交集为空。

$F(z)=\iint\limits_D 2e^{-(x+2y)}dxdy=\int_0^z 2e^{-x}dx\int_0^{\frac{z}{2}-\frac{X}{2}}e^{-2y}dy=1-e^{-z}-ze^{-z}$,$z\ge 0$

于是,求导可得,$f(z)=\begin{cases} ze^{-z},z\ge0 \\0,z<0  \end{cases}$

 

 

 

二维连续型求边缘分布函数

边缘概率分布函数的含义

$F_X(x)=P\{X\le x,Y \le +\infty \}=F_X(x,+\infty)$

$F_Y(y)=P\{X \le +\infty, Y\le y\}=F(+\infty,y)$

例题.

设随机变量$(X,Y)$的分布函数:

$F(x,y)=\frac{1}{\pi^2}(\frac{\pi}{2}+arctanx)(\frac{\pi}{2}+arctan2y)$,$-\infty<x<+\infty$,$-\infty <y<+\infty$

于是$F_X(x)=\frac{1}{\pi^2}(\frac{\pi}{2}+arctanx)(\pi)=\frac{1}{2}+\frac{1}{\pi}arctanx$

$F_Y(y)=\frac{1}{\pi^2}(\frac{\pi}{2}+arctan2y)(\pi)=\frac{1}{2}+\frac{1}{\pi}arctan2y$

 

二维连续型求边缘概率密度函数

$f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy$,$f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx$

例1.

设区域$G$是由$x-y=0,x+y=2$与$y=0$所围成的三角形区域,二维随机变量$(X,Y)$的概率密度为

$f(x,y)=\begin{cases} 1,(x,y)\in G\\0,其他  \end{cases}$

求$(X,Y)$的边缘概率密度

$f_X(x)=\begin{cases} \int_{0}^{x}1dy, 0\le x\le1\\\int_{0}^{2-x}1dy, 1<x \le2\\0,其他  \end{cases}=\begin{cases}  x, 0\le x\le1\\2-x, 1<x\le 2\\0,其他  \end{cases}$

 

$f_Y(y)=\begin{cases} \int_{y}^{2-y}1dx, 0\le y\le1 \\  \\0,其他  \end{cases}=\begin{cases}2-2y, 0\le y\le1 \\  \\0,其他 \end{cases}$

例2.

$f(x,y)=\begin{cases} 2e^{-(x+2y)} ,\;\;x>0,y>0  \\0,其他 \end{cases}$

求$(X,Y)$边缘概率密度$f_X(x)$和$f_Y(y)$。

$f_X(x)=\begin{cases}\int_0^{+\infty}2e^{-x}e^{-2y}dy,x>0\\0,其他 \end{cases}=\begin{cases} e^{-x},x>0 \\0,其他 \end{cases}$

$f_Y(y)=\begin{cases}\int_0^{+\infty}2e^{-x}e^{-2y}dx,y>0\\0,其他 \end{cases}=\begin{cases} 2e^{-2y},y>0 \\0,其他 \end{cases}$

 

$f_X(x)f_Y(y)=f(x,y) \Longleftrightarrow 独立$

 

条件概率密度函数

由条件概率公式$f(x|y)=\frac{f(xy)}{f(y)}$

可以推广到这里 $f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}$ ,$f(x,y)=f_{X|Y}(x|y) \cdot f_Y(y)$。

注意计算的时候要注意分母不能为$0$.

例1.

设区域$G$是由$x-y=0$,$x+y=2$,$y=0$围成的三角形区域,二维随机变量$(X,Y)$的概率为

$\begin{cases}f(x,y)=1,(x,y)\in G\\0,其他  \end{cases}$,求条件概率密度$f_{X|Y}(x|y)$。

先求出边缘概率密度$f_Y(y)=\begin{cases} 2-2y,0\le y \le1 \\0,其他  \end{cases}$

由于分母不能为0即$2-2y\ne 0$,所以$0\le y<1$。

于是$f_{X|Y}(x|y)=\begin{cases}\frac{1}{2-2y},y\le x \le2-y \\0,其他 \end{cases}$

 

例2.

设随机变量$X$服从$f_X(x)=\begin{cases}2x,0<x<1 \\0,其他 \end{cases}$

在$X=x(0<x<1)$的条件下,随机变量$Y$服从$f=\begin{cases} \frac{1}{2x},0<y<2x\\0,其他 \end{cases}$,求$X$和$Y$的联合概率密度函数$f(x,y)$。

$f(x,y)=f_{Y|X}(y|x)\cdot f_X(x)$,而又由题意得知$f_{Y|X}(y|x)=f$

所以,$f(x,y)=\begin{cases}1,0<x<1,0<y<2x\\0,其他  \end{cases}$

 

一维连续型求期望

$E(X)=\int_{-\infty}^{+\infty} xf_X(x)dx$

$E(g(x))=\int_{-\infty}^{+\infty} g(x)f_X(x)dx$

$D(x)=E(x^2)-E^2(x)$

二维连续型求期望

法1.先求出边缘概率密度,然后用一维方法求。

法2.求二重积分即可。

$E(X)=\iint\limits_D xf(x,y)$

$E(Y)=\iint\limits_D yf(x,y)$

均匀分布

$X\sim U[a,b]$  或 $X\sim U(a,b)$,$X$在$[a,b]$或$(a,b)$上服从均匀分布

概率密度函数$f(x)=\begin{cases} \frac{1}{b-a}, \;\;a<x<b\\0, \;\;\;其他 \end{cases}$

期望$E(X)=\int_{-\infty}^{\infty}x\cdot f(x)dx=\frac{1}{b-a}\int_a^bxdx=\frac{a+b}{2}$

方差:$D(X)=E(x^2)-E^2(x)=\int_{a}^{b}x^2\cdot f(x)dx-(\frac{a+b}{2})^2=\frac{a^2+ab+b^2}{3}-(\frac{a+b}{2})^2=\frac{(a-b)^2}{12}$

二维:$(X,Y)$在区域$G$服从均匀分布。

$P=\frac{S_D}{S_G}$,其中$S$表示面积,而$D$表示区域$G$和待求的区域的重合区域。

$f(x,y)=\begin{cases} \frac{1}{S_D},(x,y)\in G \\0,其他 \end{cases}$

 

泊松分布

$X\sim P(\lambda)$  ,$X$服从参数为$\lambda$的泊松分布。

分布律$P(X=k)=e^{-\lambda} \frac{\lambda^k}{k!},k=0,1,...,其中\lambda>0$

期望$E(X)=\sum\limits_{i=0}^{\infty}i\cdot p_i=\sum\limits_{i=0}^{\infty}i\cdot e^{-\lambda}\frac{\lambda^i}{i!}=\lambda e^{-\lambda}\sum\limits_{i=0}^{\infty} \frac{\lambda^{i-1}}{(i-1)!}=\lambda e^{-\lambda} e^\lambda=\lambda$

方差$D(X)=E(X^2)-E^2(X)=E(X(X-1)+X)-\lambda^2$

$=\sum\limits_{i=0}^{\infty}i(i-1)\frac{\lambda^i}{i!}e^{-\lambda}+\lambda-\lambda^2=\sum\limits_{i=0}^{\infty}\lambda^2\frac{\lambda^{i-2}}{(i-2)!}e^{-\lambda}+\lambda-\lambda^2=\lambda^2-\lambda^2+\lambda=\lambda$

 

指数分布

$X\sim E(\lambda)$,$X$服从参数为$\lambda$的指数分布。

$P\{X在a到b之间\}=\int_{a}^{b}f(x)dx$,其中$f(x)=\begin{cases}0,x\le 0\\\lambda e^{-\lambda x},x>0 \end{cases}$

$E(X)=\frac{1}{\lambda}$,$D(X)=\frac{1}{\lambda^2}$

$P\{X已经发生事件a,还能继续发生事件b\}=P\{X能发生事件b\}$

 

几何分布

$X\sim Ge(p)$,一直重复某试验直至发生某事件,每次试验概率相同且独立。设停止试验时,试验重复次数是$X$,则$X\sim Ge(p)$,$p$表示单次试验中事件发生的的概率。

$P\{X=k\}=(1-p)^{k-1}p$

$E(X)=\sum\limits_{i=0}^{\infty}i\cdot (1-p)^{i-1}p=p\sum\limits_{i=0}^{\infty}i\cdot (1-p)^{i-1}$

令$f=\sum\limits_{i=0}^{\infty}i\cdot(1-p)^{i-1}=\sum\limits_{i=0}^{\infty}(i+1)\cdot(1-p)^{i}$

$(1-p)f=\sum\limits_{i=0}^{\infty}i\cdot(1-p)^{i}$

于是$p\cdot f=\sum\limits_{i=0}^{\infty}(1-p)^i=\frac{1}{1-(1-p)}=\frac{1}{p}$,于是$f=\frac{1}{p^2}$

$E(X)=p\cdot f=\frac{1}{p}$

$D(X)=\frac{1-p}{p^2}$

 

 

超几何分布

$X\sim H(N,M,n)$,不放回的取,问取出某类东西数量的期望/概率。设取出的东西中有$X$个该类别的东西,则$X\sim H(N,M,n)$。

其中$N=所有类别东西总数$,$M=该类别物品总数$,$n=不放回取的个数$。

$P\{X=k\}=\frac{C_{M}^{k}C_{N-M}^{n-k}}{C_N^n}$

$E(X)=\frac{nM}{N}$,$D(X)=\frac{nM(N-M)(N-n)}{N^2(N-1)}$

 

二项分布

$X\sim B(n,p)$,重复试验$n$次,某事出现次数为$X$,单次发生概率为$p$。试验之间相互独立。

$P\{X=k\}=C_n^kp^k(1-p)^{n-k}$

$E(X)=\sum\limits_{i=0}^{\infty} i\cdot C_n^i\cdot p^i(1-p)^{n-i}=n\sum\limits_{i=0}^{\infty} \cdot C_{n-1}^{i-1}\cdot p^i(1-p)^{n-i}$

$=np\sum\limits_{i=0}^{\infty} C_{n-1}^{i-1}\cdot p^{i-1}(1-p)^{n-i}=np\sum\limits_{i=0}^{\infty} C_{n-1}^{i}\cdot p^{i}(1-p)^{n-i-1}$

$=np$

$D(X)=np(1-p)$。

如果题目求某个范围的概率,计算量大,那么用$X\sim N(np,np(1-p))$

$\lim\limits_{n\rightarrow \infty} P\{\frac{X-np}{\sqrt{np(1-p)}}\le x\}=\phi(x)$

 

特殊情况,01分布,即n=1时的二项分布。

$X\sim B(1,p)$,期望为$p$,方差为$p(1-p)$

 

正态分布

$X\sim N(\mu,\sigma^2)$,$X$服从$\mu$(均值)为多少,$\sigma$(标准差)或$\sigma^2$(方差)为多少的正态分布

注意$\sigma>0$

$f(x)=\frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$,$-\infty<x<+\infty$

标准正态分布函数$\phi(a)=\int_{-\infty}^{a}\frac{1}{\sqrt{2\pi}}e^{\frac{-x^2}{2}}dx$

$\phi'(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$,即与标准正态分布的概率密度函数相等。

$\phi(a)+\phi(-a)=1$,$\phi(0)=0.5$,$\phi(+\infty)=1$,$\phi(-\infty)=0$。

$\phi(a)>\phi(b)$,则$a>b$。

标准正态分布:$N(0,1)$ ,$\phi(x)=P\{X\le x\}$

 

$aX+c\sim N(a\mu+c,a^2\sigma^2)$

$X\sim N(\mu_1,\sigma_1^2)$、$Y\sim N(\mu_2,\sigma_2^2)$,且$X$与$Y$相互独立,则$aX+bY+cZ\sim N(a\mu_1+b\mu_2+c,a^2\sigma_1^2+b^2\sigma_2^2)$

$X\sim N(\alpha,\beta) $,那么$\frac{X-\alpha}{\sqrt{\beta}}\sim N(0,1)$

 

结论: $\int_{-\infty}^{+\infty} x\frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}=\mu$,$\int_{-\infty}^{+\infty}x^2 \frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}=\mu^2+\sigma^2$

证明: 由于$\int_{-\infty}^{+\infty} x\frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}=E(X)=\mu$ ,$\int_{-\infty}^{+\infty}x^2 \frac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}=E(X^2)=D(X)+E^2(X)=\sigma^2+\mu^2$。

 

例题1.

$\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}xe^{2x-\frac{x^2}{2}}dx=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}xe^{\frac{-x^2+4x-4+4}{2}}dx=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}xe^{\frac{-(x-2)^2}{2}+2}dx$

$=e^2\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}xe^{\frac{-(x-2)^2}{2}}edx= 2e^2$

例题2.

$\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}x^2e^{4x-\frac{x^2}{2}}dx=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}x^2e^{\frac{-x^2+8x-16+16}{2}}dx$

$=e^8\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}x^2e^{\frac{-(x-4)^2}{2}}dx=17e^8$

 

 

二维正态分布

$(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$。

$(X,Y)$服从参数为$\mu_1,\mu_2$(均值),$\sigma_1,\sigma_2$(标准差/均方差),$\rho$(相关系数)的二维正态分布。

$f(x,y)=\frac{1}{2\pi\sqrt{1-\rho^2} \sigma_1\sigma_2}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}+\frac{(y-\mu_2)^2}{\sigma_2^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}]}$,其中$-1<\rho<1$

当$X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$时,$(a_1X+c_1,a_2Y+c_2)$不一定服从二维正态分布。其中$a_1,a_2,c_1,c_2$可为任意常数。

当$$(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$$,则

1.$X\sim N(\mu_1,\sigma_1^2)$且$Y\sim N(\mu_2,\sigma_2^2)$

2.$a,b$不全为$0$时,$aX+bY+c \sim N(a\mu_1+b\mu_2+c,a^2\sigma_1^2+b^2\sigma_2^2+2\rho ab\sigma_1\sigma_2)$

3.$\frac{a}{b} \ne \frac{c}{d}$时,$(aX+bY,cX+dY)$也服从二维正态分布。

4.$\rho=0$即$X$与$Y$不相关时,$X$与$Y$相互独立,此时$P\{X在a和b之间,Y在c和d之间\}=P\{X在a和b之间\}\cdot P\{Y在c和d之间\}$

 

 

常见分布的数字特征

若$X$与$Y$相互独立,那么$D(X+Y)=D(X)+D(Y)$

否则$D(X+Y)=D(X)+D(Y)+2Cov(X,Y)$

$D(aX+bY+c)=a^2D(X)+b^2D(Y)+2abCov(X,Y)$

 

协方差$Cov(X,Y)$,即两个随机变量情况下的方差。

性质:

1.$Cov(X,Y)=E(XY)-E(X)\cdot E(Y)$

2.$\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=\frac{Cov(X,Y)}{\sigma_X\sigma_Y}$

3.$Cov(X_1\pm X_2,Y)=Cov(X_1,Y)\pm Cov(X_2,Y)$

4.$Cov(aX,bY)=abCov(X,Y)$

 

$3,4$均可以由$1$推出

 

相关系数的性质

$Y=aX+b$ ,如果$a>0$则$\rho_{XY}=1$,如果$a<0$则$\rho_{XY}=-1$

 

 

不相关,相互独立时的期望、方差。

 

$X$与$Y$相互独立,可以推出$X$与$Y$不相关。反之不成立。

$X$与$Y$不相关即$\rho_{XY}=0$ $\Longleftrightarrow$ $Cov(X,Y)=0$ $\Longleftrightarrow$ $E(XY)=E(X)\cdot E(Y)$ $\Longleftrightarrow$ $D(X\pm Y)=D(X)+D(Y)$ (注意这里无论如何都是$+$),其中$X$,$Y$分别可以换成任意未知数只含$X$,$Y$的项。

 

当$(X,Y)$服从二维正态分布时,$X$与$Y$不相关($\rho_{XY}=0$)$\Longleftrightarrow$ $X$与$Y$相互独立

当$(X,Y)$不服从二维正态分布时,$X$与$Y$不相关($\rho_{XY}=0$)$\Longleftarrow$ $X$与$Y$相互独立

 

切比雪夫不等式

$P\{|X-E(X)|\ge \varepsilon\}\le \frac{D(X)}{\varepsilon^2}$

 

辛钦大数定律

要求:独立同分布。随之而来就有期望和方差相同。

$\lim_\limits{n\rightarrow+\infty}P\left\{\left|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\frac{1}{n}\sum\limits_{i=1}^{n}E(X_i)\right|<\varepsilon\right\}=1$

 

 

中心极限定理

若$X_1,X_2,...,X_n$独立同分布。

则$\sum\limits_{i=1}^{n}X_i \sim N(E(\sum\limits_{i=1}^{n}X_i),D(\sum\limits_{i=1}^{n}X_i)) = N(nE(X),nD(X))$  。

这里的服从是近似服从。$n$越大越近似。

计算$P\{\sum\limits_{i=1}^{n}X_i\le x\}$,需要先把$\sum\limits_{i=1}^{n}X_i$标准化,变成$P \left\{ \frac{\sum\limits_{i=1}^{n}X_i-nE(X)}{\sqrt{nD(X)}}\le \frac{x-nE(X)}{\sqrt{nD(X)}}\right\}$

此时由于不等式左边服从标准正态分布$N(0,1)$,所以答案即为$\phi(\frac{x-nE(X)}{\sqrt{nD(X)}})$

 

 

统计量

$X_{(1)}、X_{(n)}、F_{(1)}(x)、F_{(n)}(x)$

最小观测量$X_{(1)}=\min\{X_1,X_2,...,X_n\}$,其分布函数$F_{(1)}(x)=1-[1-F(x)]^n$

最大观测量$X_{(n)}=\max\{X_1,X_2,...,X_n\}$,其分布函数$F_{(n)}(x)=F(x)^n$

 

判断统计量:除了$X、S、n$以外,还有其他未知字母的量不是统计量。

 

样本均值$\overline {X}=\frac{X_1+X_2+...+X_n}{n}$

样本方差$S^2=\frac{(X_1-\overline{X})^2+(X_2-\overline{X})^2+...+(X_n-\overline{X})^2}{n-1}$

样本标准差$S=\sqrt{S^2}$

除以$n-1$是为了保证标准差是对总体标准差的无偏估计。

总体方差$\sigma^2=\frac{(X_1-\overline{X})^2+(X_2-\overline{X})^2+...+(X_n-\overline{X})^2}{n}$

总体标准差$\sigma=\sqrt{\sigma^2}$

$\overline{X}$与$S$相互独立

 

 

卡方分布

若$X\sim \chi^2(n)$:

$X=X_1^2+X_2^2+...+X_n^2$ ($其中X_i \sim N(0,1),相互独立$)

$E(X)=n$,$D(X)=2n$

图像:从原点出发,先增后减。

上$\alpha$分位点:如果后面的阴影部分面积为$\alpha$,那么就是$\chi^2_{\alpha}(n)$

满足可加性:$X_1\sim \chi^2(n)$,$X_2\sim \chi^2(m)$。并且相互独立,则$X_1+X_2 \sim \chi^2(n+m)$

 

$t$分布

若$X\sim t(n)$,则$X= \frac{X_1}{\sqrt{\frac{X_2}{n}}}$ (其中$X_1 \sim N(0,1)$,$X_2 \sim \chi^2(n)$ ,相互独立)

图像:类似于标准正态分布

上$\alpha$分位点:如果后面的阴影部分面积为$\alpha$,那么就是$t_{\alpha}(n)$

 

$F$分布

若$X\sim F(n,m)$,则$X=\frac{\frac{X_1}{n}}{\frac{X_2}{m}}$,(其中$X_1\sim \chi^2(n),X_2\sim \chi^2(m)$,相互独立)

图像:类似于$\chi^2$的图像。

上$\alpha$分位点:如果后面的阴影部分面积为$\alpha$,那么就是$F_{\alpha}(n,m)$

 

 

矩估计法

$E(X^k)$:$k$阶原点矩(简称k阶矩)。

$E([X-E(X)]^k)$:$X$的$k$阶中心矩

均值是一阶矩(原点矩),方差是二阶中心矩。

$E(X^kY^L)$:$X$和$Y$的$K+L$阶混合(原点)矩。

$E([X-E(X)]^K[Y-E(Y)]^L)$:$X$和$Y$的$K+L$阶混合中心矩。

协方差是二阶混合中心矩。

思想:$n$较大时,样本矩=总体矩。比如求一阶样本矩和一阶总体矩,就是样本均值和总体均值。令它们相等即可。求得的$\hat \theta$即为$\theta$的矩估计量。

 

 

最大似然估计法

思想:使得样本$x_1,x_2,...,x_n$发生的概率最大的$\theta$值最恰当。

第一步:写出样本似然函数:$L(x_1,x_2,...,x_n;\theta)$ ,离散型则是这$n$个概率的相乘,连续型则是密度相乘。

第二步:取对数,$\ln(L(\theta))$ 。然后求驻点$\hat \theta$即为$\theta$的最大似然估计。

 

估计量的无偏性:$E(\hat \theta)=\theta$,则称$\hat \theta$是$\theta$的无偏估计。

估计量的有效性:$\theta_1,\theta_2$均为$\theta$的无偏估计,且$D(\theta_1)<D(\theta_2)$,则称$\theta_1$比$\theta_2$更有效。

 

置信度:$1-\alpha$,落在中间的概率(置信区间)是是$1-\alpha$。

 

求$\mu$的区间估计

若方差$\sigma^2$已知,则用$\frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt n}} \sim N(0,1)$ 然后计算 $[-z_{\frac{\alpha}{2}},z_{\frac{\alpha}{2}}]$

若方差$\sigma^2$未知,则用$\frac{\overline{x}-\mu}{\frac{s}{\sqrt n}} \sim t(n-1)$ 然后计算$[-t_{\frac{\alpha}{2}}(n-1),t_{\frac{\alpha}{2}}(n-1)]$

 

求$\sigma^2$的区间估计

若方差$\mu$未知,则用$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ 然后计算$[\chi^2_{1-\frac{\alpha}{2}}(n-1),\chi^2_{\frac{\alpha}{2}}(n-1)]$

 

 

 

 

假设检验

第一步:提出假设,$原假设H_0 :\mu=\mu_0$ ,$对立假设H_1:\mu\ne \mu_0$

第二步:

检查均值$\mu$

若方差$\sigma^2$已知,则用$\frac{\overline{x}-z}{\frac{\sigma}{\sqrt n}} \sim N(0,1)$      $(U检验)$

若方差$\sigma^2$未知,则用$\frac{\overline{x}-z}{\frac{s}{\sqrt n}} \sim t(n-1)$    $(T检验)$

 

检查方差$\sigma^2$

用$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$     $(\chi^2检验)$

 

第三步:拒绝域:小概率事件对应的区间(就是两边的区域)

检查均值$\mu$

若方差$\sigma^2$已知,则用$W=(-\infty,-z_{\frac{\alpha}{2}}) \cup(z_{\frac{\alpha}{2}},+\infty) $ 

若方差$\sigma^2$未知,则用$W=(-\infty,-t_{\frac{\alpha}{2}}(n-1)) \cup(t_{\frac{\alpha}{2}}(n-1),+\infty) $ 

 

检查方差$\sigma^2$

用$W=(0,\chi^2_{1-\frac{\alpha}{2}}(n-1)) \cup(\chi^2_{\frac{\alpha}{2}}(n-1),+\infty) $ 

 

第四步:做出检验

代入$\overline x ,S,\sigma^2$得统计量的值,若该值$\in W$,则拒绝$H_0$

 

posted @ 2024-01-02 21:02  mrsunss  阅读(67)  评论(0)    收藏  举报