概率论与数理统计公式梳理
概率论与数理统计公式梳理
公理化
性质公式
有限可加性
对任意有限个互斥事件\(A_1,A_2,A_3,\dots,A_n\),有
逆事件
减法公式
加法公式
--
条件概率及推论
条件概率
条件概率定义式
变式——乘法公式
推广——乘法定理
全概率
全概率公式
设事件\(A_1,A_2,A_3,\dots,A_n\)两两互斥,且对任意\(0 \leq i\leq n,P(A_i) \geq0\),
贝叶斯公式
事件的独立性
事件独立性的定义
若对于事件\(A,B\)满足
则称事件\(A,B\)相互独立。
事件独立性的推论
与公式(6)相关,若事件\(A,B\)相互独立,则有
离散型随机变量的分布律
0-1分布
二项分布
其中\(p\)是指在n重伯努利实验中,事件\(A\)发生的概率,\(X\)指事件\(A\)发生的次数。
分布律也可写成
几何分布
泊松(Poison)分布
若随机变量\(X\)服从泊松分布,则记作\(X\sim P(\lambda)\)或者\(X \sim \pi(\lambda)\)
连续型随机变量的分布律
均匀分布
密度函数
分布函数(积分)
指数分布
密度函数
分布函数
正态分布
密度函数
记为\(X\sim N(\mu,\sigma^2)\)其中\(\mu\)为均值,\(\sigma^2\)为标准差。
标准正态分布
\(X\sim N(\mu,\sigma^2 )\),令\(\mu=0,\sigma^2=1\),即\(X\sim N(0,1)\)就得到标准正态分布
标准正态分布的分布函数
其他正态分布函数到标准正态分布函数的转化
二维随机变量
二维连续型随机变量联合密度函数
二维均匀分布
其中\(G\)代表随机变量\(X,Y\)分布的区域。
二维正态分布
其中\(\mu_1,\mu_2\) 分别代表\(X,Y\)的均值,\(\sigma_1,\sigma_2\)分别代表\(X,Y\)的方差。
边缘分布
边缘分布函数
对于联合分布函数\(F(x,y)\)
-
\(X\)分量的边缘分布函数
\[F_X(x)=P(X\leqslant x,Y< +\infty)=\lim \limits_{y\rightarrow+\infty}F(x,y)=F(x,+\infty)\tag{26} \] -
\(Y\)分量的边缘分布函数
\[F_Y(y)=P(X<+\infty,Y\leqslant y)=\lim \limits_{x\rightarrow+\infty}F(x,y)=F(+\infty,y)\tag{27} \]
边缘分布律-概率可加性
设联合分布律\(P(X=x_i,Y=y_j)=p_{ij}\)其中\(i,j\in(1,2\cdots n)\)
-
\(X\)分量的边缘分布律
\[P(x=x_i)=P(X=x_i,Y<+\infty)=\sum\limits_{j=1}^{n}p_{ij}=p_{i\cdot}\qquad\boxed{i是x_i的i,对于每个x_i求和时不变}\tag{28} \] -
\(Y\)分量的边缘分布律
\[P(y=y_j)=P(X<+\infty,Y=y_j)=\sum\limits_{i=1}^{n}p_{ij}=p_{\cdot j}\qquad\boxed{j是y_j的j,对于每个y_j求和时不变}\tag{29} \]
边缘分布密度函数
-
\(X\)分量的边缘分布密度函数
\[f_X(x)=\int _{-\infty}^{+\infty}f(x,y) dy\qquad\boxed{x已知,y是变量} \tag{30} \] -
\(Y\)分量的边缘分布密度函数
\[f_Y(y)=\int _{-\infty}^{+\infty}f(x,y) dx\qquad\boxed{y已知,x是变量}\tag{31} \]
多维(二维为例)的独立可分性
连续型
若随机变量\(X,Y\)满足
则称随机变量\(X,Y\)相互独立(互为充要条件)
- 有联合分布函数和边缘分布函数关系如下
离散型
随机变量\(X,Y\)___相互独立___等价于
即
随机变量的函数及其分布
一维随机变量函数
离散型随机变量函数的分布律
设随机变量\(X,Y\),\(g(x)\)为一元函数,\(Y=g(X)\),已知\(X\)的分布律
则\(Y=g(X)\boxed{随机变量的函数}\)的分布律为
其中如果\(g(x_i)\)的值相同,但\(x_i\)不同,可以把不同的\(x_i\)对应的\(p_i\)相加,作为\(g(x_i)\)的值
连续性随机变量函数的分布函数与密度函数
设随机变量\(X,Y\),\(g(x)\)为一元连续函数,\(Y=g(X)\),已知\(X\)的密度函数\(f_X(x)\),则有,
-
分布函数
\[F_Y(y)=P_Y(Y\leqslant y)=P_Y(g(x)\leqslant y)=P(X\in I_g)=\int_{I_g}f_X(x)dx \]\(I_g=\{x|g(x)\leqslant y\}\)是实数轴上某个集合,是关于\(y\)的一个积分区间。
-
密度函数
\[f_Y(y)=F_Y'(y) \]
推论-反函数
设随机变量\(X,Y\),\(g(x)\)为一元连续函数,\(Y=g(X)\),已知\(X\)的密度函数\(f_X(x)\),\(g(X\))有反函数\(X=h(Y)\),则有
多维随机变量的函数
离散型二维随机变量函数的分布律
与一维情形一样,填表就可以。
设随机变量\(X,Y,Z\),\(g(x,y)\)为二元函数,\(Z=g(X,Y)\),已知\(X,Y\)的联合分布律,则有
同样的如果\(g(x_i,y_j)\)相同但是\(x_i,y_j\)不同,就需要合并。
推论-泊松分布可加性
设随机变量\(X,Y\)相互独立,且依次服从\(P(\lambda_1),P(\lambda_2)\),则\(Z=X+Y\sim P(\lambda_1+\lambda_2)\).
连续型二维随机变量函数
与一维情形一样,先求分布函数\(F_Z(z)\),再求导求密度函数\(f_Z(z)\)。
- 分布函数
设随机变量\(X,Y,Z\),\(g(x,y)\)为二元函数,\(Z=g(X,Y)\),已知\(X,Y\)的联合分布函数\(F(x,y)\),则有
\(D_z\)是满足函数\(g(X,Y)\)的\(X,Y\)分布区域。
- 密度函数
推论-正态分布可加性
设随机变量\(X,Y\)相互独立,且\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\),则\(Z=X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)\).
极大极小分布
设有\(n\)个随机变量\(X_1,X_2,X_3\cdots X_n\)。
-
极小分布
\(Y=\mathop{min}\limits_{1\leqslant i \leqslant n}X_i\)
直接理解为,n维变量中,所有维度的变量\(X_i\)的取值任意(\(X_i\)的取值为\(x_i\)是可变的)组合后的极小值为\(y\)。
有分布函数\(F_Y(y)\)
\[\begin{equation} \begin{aligned} F_Y(y)&=1-P(X_1>y)P(X_2>y)\cdots P(X_n>y)\\ &=1-(1-F_{1}(y))(1-F_2(y))\cdots (1-F_n(y)) \end{aligned} \qquad -\infty<y<+\infty \end{equation} \] -
极大分布
\(Y=\mathop{min}\limits_{1\leqslant i \leqslant n}X_i\)
有分布函数\(F_Z(z)\)
\[\begin{equation} \begin{aligned} F_Z(z)&=1-P(X_1\leqslant z)P(X_2\leqslant z)\cdots P(X_n\leqslant z)\\ &=F_1(z)F_2(z)\cdots F_n(y) \end{aligned} \qquad -\infty<z<+\infty \end{equation} \]
数字特征
均值
定义
-
离散型求和
\[E(X)=\sum\limits_i x_ip_i \]推广,令\(X=g(x)\)
\[E(g(X))=\sum_{i}g(x_i)p_i \] -
连续型积分
\[E(X)=\int_{-\infty}^{+\infty}xf(x)dx \]推广,令\(X=g(x)\)
\[E(g(X))=\int_{-\infty}^{+\infty}g(x)f(x)dx \]
性质
-
\(E(c)=c,c\mathbf{为常数}\)
-
\(E(aX+bY)=aE(X)+bE(Y),a,b\mathbf{为常数}\)
-
\(\mathbf{若X,Y独立},则E(XY)=E(X)E(Y)\)
中位数
定义
满足\(F(x)=\frac{1}{2}\)的取值\(x\),我们称其为中位数,记为\(\mu_{0.5}\)。
性质
分位数
给定\(0<\alpha<1\),使得\(P(X\leqslant x)=\alpha\)的取值\(x\)记作\(x_{\alpha}\),称其为分位数,由分数\(\alpha\)决定。
方差和标准差
方差
定义
推论——平方的均值减去均值的平方(均值连在一起)
性质
-
\(D(c)=0,c\mathbf{为常数}\)
-
\(D(aX)=a^2D(X),a\mathbf{为常数}\)
-
\(D(X\pm Y)=D(X)+D(Y)\pm 2E[(X-E(X))(Y-E(Y))]\),若\(X,Y\)相互独立\(D(X\pm Y)=D(X)+D(Y)\)
标准差
定义
常见分布的方差及其均值表
- \(E(X)\)
- \(D(X)\)
协方差
定义
等价于
性质
- \(cov(X,Y)=cov(Y,X)\)
- \(cov(X,X)=D(X)\)
- \(cov(aX+b,cY+d)=accov(X,Y),a,b,c,d\mathbf{为常数}\)
相关系数
定义
性质
- \(|\rho_{X,Y}|\leqslant1\)
- \(\rho_{X,Y}=0\),我们称其为\(X,Y\)不相关
- \(|\rho_{X,Y}|=1\),我们称其为\(X,Y\)完全相关,其充要条件为,存在常数\(a,b\),使得\(P(Y=aX+b)=1\)
中心极限定理
独立同分布的中心极限定理
设\(X_1,X_2,\cdots\)是一个独立同分布的随机变量的序列,且\(E(X_i)=\mu\),\(D(X_i)=\sigma^2\quad(i=1,2,\cdots)\),则对于任意一个\(x\in(-\infty,+\infty)\)都有

浙公网安备 33010602011771号