概率与数理统计公式及结论汇总
一、随机事件及其概率
- 基本等式
- \(A \cup \Omega=\Omega\)
- \(A \cap \Omega=A\)
- 吸收律
- \(A \cup \emptyset=A\)
- \(A \cap \emptyset=\emptyset\)
- \(A \cup(A B)=A\)
- \(A \cap(A \cup B)=A\)
- 差事件公式
- \(A - B=A \overline{B}=A-(A B)\)
- 反演律(德摩根定律)
- \(\overline{A \cup B}=\overline{A} \overline{B}\)
- \(\overline{A B}=\overline{A} \cup \overline{B}\)
- \(\overline{\bigcup_{i=1}^{n} A_{i}}=\bigcap_{i=1}^{n} \overline{A_{i}}\)
- \(\overline{\bigcap_{i=1}^{n} A_{i}}=\bigcup_{i=1}^{n} \overline{A_{i}}\)
二、概率的定义及其计算
- 对立事件概率
- \(P(\overline{A})=1 - P(A)\)
- 子集概率关系
- 若\(A \subset B\),则\(P(B)\geq P(A)\)(文档中“\(I(B)-P(A)\)”应为笔误,正确关系为概率的单调性)
- 加法公式
- 对任意两个事件\(A\)、\(B\),有\(P(A \cup B)=P(A)+P(B)-P(A B)\)
- 推论:\(P(A \cup B) \leq P(A)+P(B)\)
- 一般形式(多事件加法公式):\(P\left(\bigcup_{i=1}^{n} A_{i}\right)=\sum_{i=1}^{n} P\left(A_{i}\right)-\sum_{1 \leq i<j \leq n} P\left(A_{i} A_{j}\right)+\sum_{1 \leq i<j<k \leq n} P\left(A_{i} A_{j} A_{k}\right)+\cdots+(-1)^{n - 1} P\left(A_{1} A_{2} \cdots A_{n}\right)\)
三、条件概率相关公式
- 条件概率定义
- \(P(B | A)=\frac{P(A B)}{P(A)}\)(其中\(P(A)>0\))
- 乘法公式
- 两事件:\(P(A B)=P(A) P(B | A)\)(\(P(A)>0\))
- 多事件:\(P\left(A_{1} A_{2} \cdots A_{n}\right)=P\left(A_{1}\right) P\left(A_{2} | A_{1}\right) \cdots P\left(A_{n} | A_{1} A_{2} \cdots A_{n - 1}\right)\)(\(P\left(A_{1} A_{2} \cdots A_{n - 1}\right)>0\))
- 全概率公式
- 若\(B_{1}, B_{2}, \cdots, B_{n}\)是样本空间\(\Omega\)的一个划分(互斥且穷尽),则对任意事件\(A\),有\(P(A)=\sum_{i=1}^{n} P\left(A B_{i}\right)=\sum_{i=1}^{n} P\left(B_{i}\right) \cdot P\left(A | B_{i}\right)\)
- 贝叶斯(Bayes)公式
- 若\(B_{1}, B_{2}, \cdots, B_{n}\)是样本空间\(\Omega\)的一个划分,且\(P(A)>0\),\(P(B_{i})>0\)(\(i = 1,2,\cdots,n\)),则\(P\left(B_{k} | A\right)=\frac{P\left(A B_{k}\right)}{P(A)}=\frac{P\left(B_{k}\right) P\left(A | B_{k}\right)}{\sum_{i=1}^{n} P\left(B_{i}\right) P\left(A | B_{i}\right)}\)(\(k = 1,2,\cdots,n\))
四、随机变量及其分布
- 分布函数性质与计算
- 分布函数定义:\(F(x)=P(X \leq x)\)(\(-\infty < x < +\infty\))
- 概率计算:\(P(a < X \leq b)=P(X \leq b)-P(X \leq a)=F(b)-F(a)\)
五、离散型随机变量
- 0-1分布
- 概率分布:\(P(X = k)=p^{k}(1 - p)^{1 - k}\),其中\(k = 0,1\),\(0 < p < 1\)(\(p\)为事件成功概率)
- 二项分布\(B(n, p)\)
- 背景:\(n\)次独立重复试验,每次试验成功概率为\(p\),\(X\)表示成功次数
- 概率分布:\(P(X = k)=C_{n}^{k} p^{k}(1 - p)^{n - k}\),其中\(k = 0,1,\cdots,n\),\(0 < p < 1\)
- 泊松(Poisson)定理与泊松分布
- 泊松定理:若\(\lim_{n \to \infty} n p_{n}=\lambda>0\),则对任意非负整数\(k\),有\(\lim_{n \to \infty} C_{n}^{k} p_{n}^{k}\left(1 - p_{n}\right)^{n - k}=e^{-\lambda} \frac{\lambda^{k}}{k!}\)
- 泊松分布概率:\(P(X = k)=e^{-\lambda} \frac{\lambda^{k}}{k!}\),其中\(k = 0,1,2,\cdots\),\(\lambda>0\)(常用于近似二项分布,当\(n\)大、\(p\)小时)
六、连续型随机变量
- 均匀分布\(U(a, b)\)
- 概率密度函数:(f(x)=\begin{cases}\frac{1}{b - a}, & a < x < b \ 0, & 其他\end{cases})
- 分布函数:\(F(x)=\begin{cases}0, & x < a \ \frac{x - a}{b - a}, & a \leq x < b \ 1, & b \leq x\end{cases}\)
- 指数分布\(E(\lambda)\)
- 概率密度函数:(f(x)=\begin{cases}\lambda e^{-\lambda x}, & x > 0 \ 0, & 其他\end{cases})(\(\lambda>0\),为速率参数)
- 分布函数:\(F(x)=\begin{cases}0, & x < 0 \ 1 - e^{-\lambda x}, & x \geq 0\end{cases}\)(\(\lambda>0\))
- 正态分布\(N(\mu, \sigma^{2})\)
- 概率密度函数:\(f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x - \mu)^{2}}{2 \sigma^{2}}}\)(\(-\infty < x < +\infty\),\(\mu\)为均值,\(\sigma>0\)为标准差)
- 分布函数:\(F(x)=\frac{1}{\sqrt{2 \pi} \sigma} \int_{-\infty}^{x} e^{-\frac{(t - \mu)^{2}}{2 \sigma^{2}}} dt\)(\(-\infty < x < +\infty\))
- 标准正态分布\(N(0,1)\)(正态分布的特殊情况,\(\mu = 0\),\(\sigma = 1\))
- 概率密度函数:\(\varphi(x)=\frac{1}{\sqrt{2 \pi}} e{-\frac{x{2}}{2}}\)(\(-\infty < x < +\infty\))
- 分布函数:\(\Phi(x)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{x} e{-\frac{t{2}}{2}} dt\)(\(-\infty < x < +\infty\)),且满足\(\Phi(-x)=1 - \Phi(x)\)
七、多维随机变量及其分布(以二维为例)
- 二维随机变量\((X, Y)\)的分布函数(联合分布函数)
- \(F(x, y)=\int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) dv du\)(\(-\infty < x, y < +\infty\),\(f(u, v)\)为联合概率密度函数)
- 边缘分布函数与边缘密度函数
- \(X\)的边缘分布函数:\(F_{X}(x)=\int_{-\infty}^{x} \int_{-\infty}^{+\infty} f(u, v) dv du\)(即\(F(x, +\infty)\))
- \(X\)的边缘概率密度函数:\(f_{X}(x)=\int_{-\infty}^{+\infty} f(x, v) dv\)
- \(Y\)的边缘分布函数:\(F_{Y}(y)=\int_{-\infty}^{y} \int_{-\infty}^{+\infty} f(u, v) du dv\)(即\(F(+\infty, y)\))
- \(Y\)的边缘概率密度函数:\(f_{Y}(y)=\int_{-\infty}^{+\infty} f(u, y) du\)
八、常见连续型二维随机变量
- 区域\(G\)上的均匀分布\(U(G)\)
- 联合概率密度函数:(f(x, y)=\begin{cases}\frac{1}{A}, & (x, y) \in G \ 0, & 其他\end{cases})(\(A\)为区域\(G\)的面积)
- 二维正态分布
- 联合概率密度函数:\(f(x, y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1 - \rho^{2}}} e^{-\frac{1}{2\left(1 - \rho^{2}\right)}\left[\frac{\left(x - \mu_{1}\right){2}}{\sigma_{1}{2}} - 2 \rho \frac{\left(x - \mu_{1}\right)\left(y - \mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y - \mu_{2}\right){2}}{\sigma_{2}{2}}\right]}\)(文档中公式尾部缺失,此处补充完整),其中\(\mu_{1},\mu_{2}\)为均值,\(\sigma_{1}>0,\sigma_{2}>0\)为标准差,\(\rho\)为相关系数(\(|\rho| \leq 1\))
九、二维随机变量的条件分布
- 条件概率密度函数关系
- 联合密度与条件密度:\(f(x, y)=f_{X}(x) f_{Y | X}(y | x)\)(\(f_{X}(x)>0\));\(f(x, y)=f_{Y}(y) f_{X | Y}(x | y)\)(\(f_{Y}(y)>0\))
- 边缘密度与条件密度:\(f_{X}(x)=\int_{-\infty}^{+\infty} f(x, y) dy=\int_{-\infty}^{+\infty} f_{X | Y}(x | y) f_{Y}(y) dy\);\(f_{Y}(y)=\int_{-\infty}^{+\infty} f(x, y) dx=\int_{-\infty}^{+\infty} f_{Y | X}(y | x) f_{X}(x) dx\)
- 条件概率密度公式
- \(f_{X | Y}(x | y)=\frac{f(x, y)}{f_{Y}(y)}=\frac{f_{Y | X}(y | x) f_{X}(x)}{f_{Y}(y)}\)(\(f_{Y}(y)>0\))
- \(f_{Y | X}(y | x)=\frac{f(x, y)}{f_{X}(x)}=\frac{f_{X | Y}(x | y) f_{Y}(y)}{f_{X}(x)}\)(\(f_{X}(x)>0\))
十、随机变量的数字特征
- 数学期望(均值)
- 离散型随机变量:\(E(X)=\sum_{k=1}^{+\infty} x_{k} p_{k}\)(\(x_{k}\)为取值,\(p_{k}=P(X = x_{k})\),要求级数绝对收敛)
- 连续型随机变量:\(E(X)=\int_{-\infty}^{+\infty} x f(x) dx\)(\(f(x)\)为概率密度,要求积分绝对收敛)
- 常用矩(数字特征的基础)
- \(X\)的\(k\)阶原点矩:\(E(X^{k})\)
- \(X\)的\(k\)阶绝对原点矩:\(E(|X|^{k})\)
- \(X\)的\(k\)阶中心矩:\(E((X - E(X))^{k})\)
- \(X\)与\(Y\)的\(k + l\)阶混合原点矩:\(E(X^{k} Y^{l})\)
- \(X\)与\(Y\)的\(k + l\)阶混合中心矩:\(E\left((X - E(X))^{k}(Y - E(Y))^{l}\right)\)
- \(X\)与\(Y\)的二阶混合原点矩:\(E(X Y)\)
- \(X\)与\(Y\)的二阶混合中心矩:协方差\(cov(X, Y)=E((X - E(X))(Y - E(Y)))\)
- 方差(二阶中心矩,衡量离散程度)
- 定义式:\(D(X)=E\left{[X - E(X)]^{2}\right}\)
- 计算式:\(D(X)=E(X{2})-[E(X)]\)(更易计算,需先求\(E(X)\)和\(E(X^{2})\))
- 协方差(衡量两变量线性相关程度)
- 定义式:\(cov(X, Y)=E((X - E(X))(Y - E(Y)))\)
- 计算式1:\(cov(X, Y)=E(X Y)-E(X) E(Y)\)
- 计算式2:\(cov(X, Y)=\pm \frac{1}{2}(D(X \pm Y)-D(X)-D(Y))\)(可根据\(D(X + Y)\)或\(D(X - Y)\)推导)
- 相关系数(标准化的协方差,消除量纲影响)
- 定义式:\(\rho_{X Y}=\frac{cov(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}\)(其中\(D(X)>0\),\(D(Y)>0\))
- 性质:\(|\rho_{X Y}| \leq 1\);\(|\rho_{X Y}| = 1\)的充要条件是存在常数\(a, b\)(\(a \neq 0\)),使得\(P(Y = a X + b)=1\)(即两变量线性相关)
posted @
2025-09-05 16:03
kkman2000
阅读(
60)
评论()
收藏
举报