概率期望学习笔记

概率

样本、事件基本概念

在一次随机试验 \(E\) 中可能发生的不能再细分的结果称为基本事件（或样本输出），记作 \(\omega\)。在随机试验 \(E\) 中可能发生的所有样本输出的集合称为基本事件空间（或样本空间），记作 \(\Omega\)。一次随机试验的结果一定是基本事件空间 \(\Omega\) 中的恰好一个元素。例如：随机试验 \(E\) 是掷一次骰子，得到的点数为基本事件，则基本事件空间 \(\Omega=\{1,2,3,4,5,6\}\)。

随机事件（事件）是基本事件空间 \(\Omega\) 的子集，用大写字母表示。例如：随机试验 \(E\) 是掷两次骰子，随机事件 \(A\) 为“第二次点数是第一次的两倍”，则 \(A=\{(1,2),(2,4),(3,6)\}\)。

基本事件空间 \(\Omega\) 也是 \(\Omega\) 的子集，每次试验它必然发生，称为必然事件。空集 \(\varnothing\) 也是 \(\Omega\) 的子集，每次试验它不可能发生，称为不可能事件。

事件的关系和运算

若 \(A\) 发生必然导致 \(B\) 发生，则称 \(B\) 包含 \(A\) 或 \(A\) 是 \(B\) 的子事件，记作 \(A\subset B\)。

若 \(A\subset B\land B\subset A\)，则称 \(A\) 与 \(B\) 相等，记作 \(A=B\)。

定义两个事件 \(A,B\) 的和事件 \(C\) 为 \(A\) 发生或 \(B\) 发生，记作 \(C=A\cup B\) 或 \(C=A+B\)。类似地可以定义多个事件的和事件。

定义两个事件 \(A,B\) 的积事件 \(C\) 为 \(A\) 发生且 \(B\) 发生，记作 \(C=A\cap B\) 或 \(C=AB\)。类似地可以定义多个事件的积事件。

定义两个事件 \(A,B\) 的差事件 \(C\) 为 \(A\) 发生且 \(B\) 不发生，记作 \(C=A\setminus B\) 或 \(C=A-B\)。易知 \(A-B=A-AB\)。

若两个事件 \(A,B\) 不可能同时发生，即 \(AB=\varnothing\)，则称 \(A\) 与 \(B\) 互斥（或 \(A\) 与 \(B\) 为互斥事件，或 \(A\) 与 \(B\) 互不相容）。

称“\(A\) 不发生”为 \(A\) 的对立事件，记作 \(\overline{A}\)，即 \(\overline{A}=\Omega-A\)，称 \(A\) 与 \(\overline{A}\) 对立（或 \(A\) 与 \(\overline{A}\) 互逆）。易知 \(A+\overline{A}=\Omega\)，\(A\overline{A}=\varnothing\)，\(\overline{\overline{A}}=A\)，\(A-B=A\overline{B}\)。

设 \(A_1,A_2,\cdots,A_n\) 是一组事件，若它们两两互斥，且它们的和是整个基本事件空间 \(\Omega\)，则称它们是 \(\Omega\) 的一个划分，并称它们是一个完备事件组。

事件运算有以下规则：

交换律：\(A+B=B+A\)，\(AB=BA\)。
结合律：\((A+B)+C=A+(B+C)\)，\((AB)C=A(BC)\)。
分配律：\(A(B+C)=(AB)+(AC)\)，\(A+(BC)=(A+B)(A+C)\)。
对偶律：\(\overline{A+B}=\overline{A}\ \overline{B}\)，\(\overline{AB}=\overline{A}+\overline{B}\)。
可以证明多个事件时上面四个运算律依然成立。

事件的频数和频率

在相同条件下，重复进行 \(n\) 次试验，事件 \(A\) 发生的次数 \(n_A\) 称为事件 \(A\) 发生的频数，\(\dfrac{n_A}{n}\) 称为事件 \(A\) 发生的频率，记作 \(f_n(A)\)。

频率满足下面三条性质：

非负性：\(f_n(A)\ge 0\)。
规范性：\(f_n(\Omega)=1\)。
有限可加性：若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件，则 \(f_n\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kf_n(A_i)\)。

概率的统计定义和性质

在相同条件下，重复进行 \(n\) 次试验，随着试验次数 \(n\) 的增大，事件 \(A\) 发生的频率 \(f_n(A)\) 在 \([0,1]\) 上某个值 \(p\) 附近摆动，呈现出一定的稳定性，则称 \(p\) 为 \(A\) 在该条件下的概率，记作 \(P(A)=p\)。

概率满足下面三条公理：

非负性：\(P(A)\ge 0\)。
规范性：\(P(\Omega)=1\)。
可列可加性：若 \(A_1,A_2,\cdots\) 为两两互斥事件，则 \(P\left(\bigcup\limits_{i=1}^{+\infty}A_i\right)=\sum\limits_{i=1}^{+\infty}P(A_i)\)。

概率满足下面的性质：

\(P(\varnothing)=0\)。
有限可加性：若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件，则 \(P\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kP(A_i)\)。
\(P(\overline{A})=1-P(A)\)。
\(P(A-B)=P(A)-P(AB)\)。特别地，若 \(B\subset A\)，则有 \(P(A-B)=P(A)-P(B)\)。
\(P(A)\le 1\)。
广义加法公式：\(P(A+B)=P(A)+P(B)-P(AB)\)。

古典概型

如果随机试验 \(E\) 满足：

有限性：试验可能的基本事件有有限个。
等可能性：试验中每个基本事件出现的可能性相等。

则称这种概率模型为古典概型。

对于古典概型中的事件 \(A\)，设 \(n\) 为基本事件空间大小，\(m\) 为 \(A\) 包含的基本事件个数，则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)。

例如：随机试验 \(E\) 是掷一次骰子，随机事件 \(A\) 为点数不超过 \(2\)，则 \(n=6,m=2\)，所以 \(P(A)=\dfrac{2}{6}=\dfrac{1}{3}\)。

几何概型

如果随机试验 \(E\) 满足：

无限性：试验可能的基本事件有无限个。
等可能性：试验中每个基本事件出现的可能性相等。

则称这种概率模型为几何概型。

对于几何概型中的事件 \(A\)，设 \(n\) 为基本事件空间的测度（常为长度、角度、面积、体积等），\(m\) 为 \(A\) 包含的基本事件的测度，则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)。

例如：随机试验 \(E\) 是在一个正方形内随机选一个点，随机事件 \(A\) 为这个点在正方形的内切圆内，设正方形边长为 \(2x\)，则正方形的面积为 \(4x^2\)，内切圆面积为 \(\pi x^2\)，所以 \(P(A)=\dfrac{\pi x^2}{4x^2}=\dfrac{\pi}{4}\)。

条件概率

设 \(A,B\) 是两个事件，且 \(P(B) > 0\)，则已知 \(B\) 发生的条件下 \(A\) 发生的概率为 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}\)。

条件概率满足概率的三条公理，也是概率，因此满足概率的所有性质，另外有下列公式：

乘法公式：\(P(AB)=P(A)P(B\mid A)=P(B)P(A\mid B)\)。更一般地，\(P(A_1A_2\cdots A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)\cdots P(A_n\mid A_1A_2\cdots A_{n-1})\)。
全概率公式：设 \(A_1,A_2,\cdots,A_n\) 是 \(\Omega\) 的一个划分且都有正概率，\(B\) 为一个事件，由它们两两互斥知它们在 \(B\) 条件下也两两互斥，再由概率的有限可加性和乘法公式可知 \(P(B)=\sum\limits_{i=1}^nP(A_iB)=\sum\limits_{i=1}^nP(A_i)P(B\mid A_i)\)。特别地，当 \(n=2\) 时，记 \(A_1=A,A_2=\overline{A}\)，则有 \(P(B)=P(A)P(B\mid A)+P(\overline{A})P(B\mid\overline{A})\)。
贝叶斯定理：设 \(A_1,A_2,\cdots,A_n\) 是 \(\Omega\) 的一个划分且都有正概率，\(B\) 为一个事件且有正概率，则有 \(P(A_i\mid B)=\dfrac{P(A_iB)}{P(B)}=\dfrac{P(A_i)P(B\mid A_i)}{\sum\limits_{j=1}^nP(A_j)P(B\mid A_j)}\)。

事件的独立性

若事件 \(A,B\) 满足 \(P(A)=P(A\mid B)\)，则称 \(A\) 与 \(B\) 独立。

若 \(A\) 与 \(B\) 独立，由乘法公式知 \(P(AB)=P(A\mid B)P(B)=P(A)P(B)\)。

反之，若 \(P(AB)=P(A)P(B)\)，由条件概率知 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}=\dfrac{P(A)P(B)}{P(B)}=P(A)\)。

综上，\(P(AB)=P(A)P(B)\iff P(A)=P(A\mid B)\)。若 \(P(AB)=P(A)P(B)\)，则 \(A\) 与 \(B\) 独立。

若事件 \(A,B,C\) 满足 \(P(AB)=P(A)P(B)\land P(BC)=P(B)P(C)\land P(AC)=P(A)P(C)\)，则称 \(A,B,C\) 两两独立。

若 \(A,B,C\) 两两独立，且 \(P(ABC)=P(A)P(B)P(C)\)，则称 \(A,B,C\) 相互独立。

随机变量和期望

随机变量

随机变量是取值由随机事件决定的变量。

当随机变量 \(X\) 取值 \(\alpha\) 的时候，也对应着一个基本事件的集合，因此 \(X=\alpha\) 也是一个事件。

我们记 \(X\) 的取值范围为 \(I(X)\)。

若随机变量 \(X,Y\) 满足 \(P((X=\alpha)(Y=\beta))=P(X=\alpha)P(Y=\beta),\forall\alpha\in I(X),\beta\in I(Y)\)，则称 \(X\) 与 \(Y\) 独立。

类似于随机事件定义两两独立和相互独立。

期望的定义

如果一个随机变量的取值个数有限（如掷骰子），或可能的取值可以一一列举出来（如正整数），则称其为离散型随机变量。

一个离散型随机变量 \(X\) 的数学期望是其每个取值乘以该取值对应概率的总和，记作 \(E(X)\)。

\[E(X)=\sum\limits_{\alpha\in I(X)}\alpha P(X=\alpha)=\sum\limits_{\omega\in S}X(\omega)P(\omega) \]

其中 \(S\) 是 \(X\) 所在概率空间的样本集合。

如果一个随机变量的取值不可列（如实数），则称其为连续型随机变量。

假设一个连续型随机变量 \(X\) 取值为 \(\xi\) 的概率为 \(p(\xi)\)，则定义其期望为：

\[E(x)=\int_{-\infty}^{+\infty}xp(x)\textrm{d}x \]

条件期望

设 \(A\) 是事件，\(X\) 是随机变量，且 \(P(A) > 0\)，则已知 \(A\) 发生的条件下 \(X\) 的期望为 \(E(X\mid A)\)。

当 \(X,Y\) 均为离散型随机变量时，\(E(X\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha P(X=\alpha\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha\dfrac{P((X=\alpha)(Y=\beta))}{P(Y=\beta)}\)。

当 \(X\) 为连续型随机变量，\(Y\) 为离散型随机变量时，\(\displaystyle E(X\mid Y=\beta)=\int_{I(X)}\alpha f_X(\alpha\mid Y=\beta)\textrm{d}\alpha\)，其中 \(f_X(*\mid Y=\beta)\) 是给定 \(Y=\beta\) 下 \(X\) 的条件概率密度函数。

期望的性质

期望的线性性：对于任意两个随机变量 \(X,Y\)（不要求独立），\(E(X+Y)=E(X)+E(Y)\)。
积的期望：对于任意两个独立的随机变量 \(X,Y\)，\(E(XY)=E(X)E(Y)\)。
全期望公式：对于随机变量 \(X,Y\)，由全概率公式可以证明 \(E(Y)=\sum\limits_{\alpha\in I(X)}P(X=\alpha)E(Y\mid X=\alpha)\)。

一些题目

绿豆蛙的归宿

讲了那么多理论知识感觉脑壳疼，来看几道题吧。

这是一道经典期望 DP。

设 \({dp}_u\) 表示节点 \(u\) 走到节点 \(n\) 的路径总长度期望，初始时 \({dp}_n=0\)。考虑建反图拓扑排序来倒推。

由期望的线性性，我们可以对每条边分别计算贡献，写出转移方程：\({dp}_u=\dfrac{1}{d_u}\sum\limits_{(u,v,w)\in E}({dp}_v+w)\)。最后 \({dp}_1\) 即为答案。

[SHOI2002] 百事世界杯之旅

设 \({dp}_i\) 表示已有 \(i\) 个名字，要收集到 \(n\) 个名字的期望次数。

有 \(\dfrac{n-i}{n}\) 的概率收集到新名字，有 \(\dfrac{i}{n}\) 的概率收集不到，列出方程：\({dp}_i=\dfrac{n-i}{n}{dp}_{i+1}+\dfrac{i}{n}{dp}_i+1\)。

解方程得 \({dp}_i={dp}_{i+1}+\dfrac{n}{n-i}\)，代初始值 \({dp}_n=0\) 容易发现答案就是 \(n\cdot\left(\dfrac{n}{1}+\dfrac{n}{2}+\cdots+\dfrac{n}{n}\right)\)。

这个输出方式太阴间了（虽说不是很难写），出题人是不会有理数取模吗。。

[六省联考 2017] 分手是祝愿

首先开关的操作是诈骗，显然可以知道最少的操作步数，因为只有第 \(n\) 个开关能控制第 \(n\) 个灯，确认了第 \(n\) 个开关是否操作后可以同理向前递推。

接下来就是另一个问题：需要操作 \(m\) 步，等概率随机操作一次会产生影响，直到需要操作步数不超过 \(k\)。

我们设 \({dp}_i\) 表示从还需要操作 \(i\) 步变成还需要操作 \(i-1\) 步的期望操作次数，首先有 \(\dfrac{i}{n}\) 的概率直接进行正确操作，其次剩余的 \(1-\dfrac{i}{n}\) 的概率会错误操作，这时候需要的操作次数变为了 \(i+1\)，需要先操作成 \(i\) 再操作成 \(i-1\)，列出方程：\({dp}_i=\dfrac{i}{n}+\left(1-\dfrac{i}{n}\right)(1+{dp}_{i+1}+{dp}_i)\)。

看着没法推，实际上把这个方程解出来问题就解决了，解得 \({dp}_i=1+\dfrac{n+(n-i)\cdot{dp}_{i+1}}{i}\)。根据题意累加一部分 \(dp\) 值即可，记得乘以 \(n!\)。

posted @ 2022-06-28 12:37 rui_er 阅读(265) 评论(0) 收藏举报

刷新页面返回顶部

rui_er 的博客

Think twice, code once.

概率期望学习笔记

概率期望学习笔记

概率

样本、事件基本概念

事件的关系和运算

事件的频数和频率

概率的统计定义和性质

古典概型

几何概型

条件概率

事件的独立性

随机变量和期望

随机变量

期望的定义

条件期望

期望的性质

一些题目

绿豆蛙的归宿

[SHOI2002] 百事世界杯之旅

[六省联考 2017] 分手是祝愿

公告