概率期望学习笔记
概率期望学习笔记
概率
样本、事件基本概念
在一次随机试验 \(E\) 中可能发生的不能再细分的结果称为基本事件(或样本输出),记作 \(\omega\)。在随机试验 \(E\) 中可能发生的所有样本输出的集合称为基本事件空间(或样本空间),记作 \(\Omega\)。一次随机试验的结果一定是基本事件空间 \(\Omega\) 中的恰好一个元素。例如:随机试验 \(E\) 是掷一次骰子,得到的点数为基本事件,则基本事件空间 \(\Omega=\{1,2,3,4,5,6\}\)。
随机事件(事件)是基本事件空间 \(\Omega\) 的子集,用大写字母表示。例如:随机试验 \(E\) 是掷两次骰子,随机事件 \(A\) 为“第二次点数是第一次的两倍”,则 \(A=\{(1,2),(2,4),(3,6)\}\)。
基本事件空间 \(\Omega\) 也是 \(\Omega\) 的子集,每次试验它必然发生,称为必然事件。空集 \(\varnothing\) 也是 \(\Omega\) 的子集,每次试验它不可能发生,称为不可能事件。
事件的关系和运算
若 \(A\) 发生必然导致 \(B\) 发生,则称 \(B\) 包含 \(A\) 或 \(A\) 是 \(B\) 的子事件,记作 \(A\subset B\)。
若 \(A\subset B\land B\subset A\),则称 \(A\) 与 \(B\) 相等,记作 \(A=B\)。
定义两个事件 \(A,B\) 的和事件 \(C\) 为 \(A\) 发生或 \(B\) 发生,记作 \(C=A\cup B\) 或 \(C=A+B\)。类似地可以定义多个事件的和事件。
定义两个事件 \(A,B\) 的积事件 \(C\) 为 \(A\) 发生且 \(B\) 发生,记作 \(C=A\cap B\) 或 \(C=AB\)。类似地可以定义多个事件的积事件。
定义两个事件 \(A,B\) 的差事件 \(C\) 为 \(A\) 发生且 \(B\) 不发生,记作 \(C=A\setminus B\) 或 \(C=A-B\)。易知 \(A-B=A-AB\)。
若两个事件 \(A,B\) 不可能同时发生,即 \(AB=\varnothing\),则称 \(A\) 与 \(B\) 互斥(或 \(A\) 与 \(B\) 为互斥事件,或 \(A\) 与 \(B\) 互不相容)。
称“\(A\) 不发生”为 \(A\) 的对立事件,记作 \(\overline{A}\),即 \(\overline{A}=\Omega-A\),称 \(A\) 与 \(\overline{A}\) 对立(或 \(A\) 与 \(\overline{A}\) 互逆)。易知 \(A+\overline{A}=\Omega\),\(A\overline{A}=\varnothing\),\(\overline{\overline{A}}=A\),\(A-B=A\overline{B}\)。
设 \(A_1,A_2,\cdots,A_n\) 是一组事件,若它们两两互斥,且它们的和是整个基本事件空间 \(\Omega\),则称它们是 \(\Omega\) 的一个划分,并称它们是一个完备事件组。
事件运算有以下规则:
- 交换律:\(A+B=B+A\),\(AB=BA\)。
- 结合律:\((A+B)+C=A+(B+C)\),\((AB)C=A(BC)\)。
- 分配律:\(A(B+C)=(AB)+(AC)\),\(A+(BC)=(A+B)(A+C)\)。
- 对偶律:\(\overline{A+B}=\overline{A}\ \overline{B}\),\(\overline{AB}=\overline{A}+\overline{B}\)。
- 可以证明多个事件时上面四个运算律依然成立。
事件的频数和频率
在相同条件下,重复进行 \(n\) 次试验,事件 \(A\) 发生的次数 \(n_A\) 称为事件 \(A\) 发生的频数,\(\dfrac{n_A}{n}\) 称为事件 \(A\) 发生的频率,记作 \(f_n(A)\)。
频率满足下面三条性质:
- 非负性:\(f_n(A)\ge 0\)。
- 规范性:\(f_n(\Omega)=1\)。
- 有限可加性:若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件,则 \(f_n\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kf_n(A_i)\)。
概率的统计定义和性质
在相同条件下,重复进行 \(n\) 次试验,随着试验次数 \(n\) 的增大,事件 \(A\) 发生的频率 \(f_n(A)\) 在 \([0,1]\) 上某个值 \(p\) 附近摆动,呈现出一定的稳定性,则称 \(p\) 为 \(A\) 在该条件下的概率,记作 \(P(A)=p\)。
概率满足下面三条公理:
- 非负性:\(P(A)\ge 0\)。
- 规范性:\(P(\Omega)=1\)。
- 可列可加性:若 \(A_1,A_2,\cdots\) 为两两互斥事件,则 \(P\left(\bigcup\limits_{i=1}^{+\infty}A_i\right)=\sum\limits_{i=1}^{+\infty}P(A_i)\)。
概率满足下面的性质:
- \(P(\varnothing)=0\)。
- 有限可加性:若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件,则 \(P\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kP(A_i)\)。
- \(P(\overline{A})=1-P(A)\)。
- \(P(A-B)=P(A)-P(AB)\)。特别地,若 \(B\subset A\),则有 \(P(A-B)=P(A)-P(B)\)。
- \(P(A)\le 1\)。
- 广义加法公式:\(P(A+B)=P(A)+P(B)-P(AB)\)。
古典概型
如果随机试验 \(E\) 满足:
- 有限性:试验可能的基本事件有有限个。
- 等可能性:试验中每个基本事件出现的可能性相等。
则称这种概率模型为古典概型。
对于古典概型中的事件 \(A\),设 \(n\) 为基本事件空间大小,\(m\) 为 \(A\) 包含的基本事件个数,则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)。
例如:随机试验 \(E\) 是掷一次骰子,随机事件 \(A\) 为点数不超过 \(2\),则 \(n=6,m=2\),所以 \(P(A)=\dfrac{2}{6}=\dfrac{1}{3}\)。
几何概型
如果随机试验 \(E\) 满足:
- 无限性:试验可能的基本事件有无限个。
- 等可能性:试验中每个基本事件出现的可能性相等。
则称这种概率模型为几何概型。
对于几何概型中的事件 \(A\),设 \(n\) 为基本事件空间的测度(常为长度、角度、面积、体积等),\(m\) 为 \(A\) 包含的基本事件的测度,则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)。
例如:随机试验 \(E\) 是在一个正方形内随机选一个点,随机事件 \(A\) 为这个点在正方形的内切圆内,设正方形边长为 \(2x\),则正方形的面积为 \(4x^2\),内切圆面积为 \(\pi x^2\),所以 \(P(A)=\dfrac{\pi x^2}{4x^2}=\dfrac{\pi}{4}\)。
条件概率
设 \(A,B\) 是两个事件,且 \(P(B) > 0\),则已知 \(B\) 发生的条件下 \(A\) 发生的概率为 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}\)。
条件概率满足概率的三条公理,也是概率,因此满足概率的所有性质,另外有下列公式:
- 乘法公式:\(P(AB)=P(A)P(B\mid A)=P(B)P(A\mid B)\)。更一般地,\(P(A_1A_2\cdots A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)\cdots P(A_n\mid A_1A_2\cdots A_{n-1})\)。
- 全概率公式:设 \(A_1,A_2,\cdots,A_n\) 是 \(\Omega\) 的一个划分且都有正概率,\(B\) 为一个事件,由它们两两互斥知它们在 \(B\) 条件下也两两互斥,再由概率的有限可加性和乘法公式可知 \(P(B)=\sum\limits_{i=1}^nP(A_iB)=\sum\limits_{i=1}^nP(A_i)P(B\mid A_i)\)。特别地,当 \(n=2\) 时,记 \(A_1=A,A_2=\overline{A}\),则有 \(P(B)=P(A)P(B\mid A)+P(\overline{A})P(B\mid\overline{A})\)。
- 贝叶斯定理:设 \(A_1,A_2,\cdots,A_n\) 是 \(\Omega\) 的一个划分且都有正概率,\(B\) 为一个事件且有正概率,则有 \(P(A_i\mid B)=\dfrac{P(A_iB)}{P(B)}=\dfrac{P(A_i)P(B\mid A_i)}{\sum\limits_{j=1}^nP(A_j)P(B\mid A_j)}\)。
事件的独立性
若事件 \(A,B\) 满足 \(P(A)=P(A\mid B)\),则称 \(A\) 与 \(B\) 独立。
若 \(A\) 与 \(B\) 独立,由乘法公式知 \(P(AB)=P(A\mid B)P(B)=P(A)P(B)\)。
反之,若 \(P(AB)=P(A)P(B)\),由条件概率知 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}=\dfrac{P(A)P(B)}{P(B)}=P(A)\)。
综上,\(P(AB)=P(A)P(B)\iff P(A)=P(A\mid B)\)。若 \(P(AB)=P(A)P(B)\),则 \(A\) 与 \(B\) 独立。
若事件 \(A,B,C\) 满足 \(P(AB)=P(A)P(B)\land P(BC)=P(B)P(C)\land P(AC)=P(A)P(C)\),则称 \(A,B,C\) 两两独立。
若 \(A,B,C\) 两两独立,且 \(P(ABC)=P(A)P(B)P(C)\),则称 \(A,B,C\) 相互独立。
随机变量和期望
随机变量
随机变量是取值由随机事件决定的变量。
当随机变量 \(X\) 取值 \(\alpha\) 的时候,也对应着一个基本事件的集合,因此 \(X=\alpha\) 也是一个事件。
我们记 \(X\) 的取值范围为 \(I(X)\)。
若随机变量 \(X,Y\) 满足 \(P((X=\alpha)(Y=\beta))=P(X=\alpha)P(Y=\beta),\forall\alpha\in I(X),\beta\in I(Y)\),则称 \(X\) 与 \(Y\) 独立。
类似于随机事件定义两两独立和相互独立。
期望的定义
如果一个随机变量的取值个数有限(如掷骰子),或可能的取值可以一一列举出来(如正整数),则称其为离散型随机变量。
一个离散型随机变量 \(X\) 的数学期望是其每个取值乘以该取值对应概率的总和,记作 \(E(X)\)。
其中 \(S\) 是 \(X\) 所在概率空间的样本集合。
如果一个随机变量的取值不可列(如实数),则称其为连续型随机变量。
假设一个连续型随机变量 \(X\) 取值为 \(\xi\) 的概率为 \(p(\xi)\),则定义其期望为:
条件期望
设 \(A\) 是事件,\(X\) 是随机变量,且 \(P(A) > 0\),则已知 \(A\) 发生的条件下 \(X\) 的期望为 \(E(X\mid A)\)。
当 \(X,Y\) 均为离散型随机变量时,\(E(X\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha P(X=\alpha\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha\dfrac{P((X=\alpha)(Y=\beta))}{P(Y=\beta)}\)。
当 \(X\) 为连续型随机变量,\(Y\) 为离散型随机变量时,\(\displaystyle E(X\mid Y=\beta)=\int_{I(X)}\alpha f_X(\alpha\mid Y=\beta)\textrm{d}\alpha\),其中 \(f_X(*\mid Y=\beta)\) 是给定 \(Y=\beta\) 下 \(X\) 的条件概率密度函数。
期望的性质
- 期望的线性性:对于任意两个随机变量 \(X,Y\)(不要求独立),\(E(X+Y)=E(X)+E(Y)\)。
- 积的期望:对于任意两个独立的随机变量 \(X,Y\),\(E(XY)=E(X)E(Y)\)。
- 全期望公式:对于随机变量 \(X,Y\),由全概率公式可以证明 \(E(Y)=\sum\limits_{\alpha\in I(X)}P(X=\alpha)E(Y\mid X=\alpha)\)。
一些题目
绿豆蛙的归宿
讲了那么多理论知识感觉脑壳疼,来看几道题吧。
这是一道经典期望 DP。
设 \({dp}_u\) 表示节点 \(u\) 走到节点 \(n\) 的路径总长度期望,初始时 \({dp}_n=0\)。考虑建反图拓扑排序来倒推。
由期望的线性性,我们可以对每条边分别计算贡献,写出转移方程:\({dp}_u=\dfrac{1}{d_u}\sum\limits_{(u,v,w)\in E}({dp}_v+w)\)。最后 \({dp}_1\) 即为答案。
[SHOI2002] 百事世界杯之旅
设 \({dp}_i\) 表示已有 \(i\) 个名字,要收集到 \(n\) 个名字的期望次数。
有 \(\dfrac{n-i}{n}\) 的概率收集到新名字,有 \(\dfrac{i}{n}\) 的概率收集不到,列出方程:\({dp}_i=\dfrac{n-i}{n}{dp}_{i+1}+\dfrac{i}{n}{dp}_i+1\)。
解方程得 \({dp}_i={dp}_{i+1}+\dfrac{n}{n-i}\),代初始值 \({dp}_n=0\) 容易发现答案就是 \(n\cdot\left(\dfrac{n}{1}+\dfrac{n}{2}+\cdots+\dfrac{n}{n}\right)\)。
这个输出方式太阴间了(虽说不是很难写),出题人是不会有理数取模吗。。
[六省联考 2017] 分手是祝愿
首先开关的操作是诈骗,显然可以知道最少的操作步数,因为只有第 \(n\) 个开关能控制第 \(n\) 个灯,确认了第 \(n\) 个开关是否操作后可以同理向前递推。
接下来就是另一个问题:需要操作 \(m\) 步,等概率随机操作一次会产生影响,直到需要操作步数不超过 \(k\)。
我们设 \({dp}_i\) 表示从还需要操作 \(i\) 步变成还需要操作 \(i-1\) 步的期望操作次数,首先有 \(\dfrac{i}{n}\) 的概率直接进行正确操作,其次剩余的 \(1-\dfrac{i}{n}\) 的概率会错误操作,这时候需要的操作次数变为了 \(i+1\),需要先操作成 \(i\) 再操作成 \(i-1\),列出方程:\({dp}_i=\dfrac{i}{n}+\left(1-\dfrac{i}{n}\right)(1+{dp}_{i+1}+{dp}_i)\)。
看着没法推,实际上把这个方程解出来问题就解决了,解得 \({dp}_i=1+\dfrac{n+(n-i)\cdot{dp}_{i+1}}{i}\)。根据题意累加一部分 \(dp\) 值即可,记得乘以 \(n!\)。

 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号