概率期望学习笔记

概率期望学习笔记

概率

样本、事件基本概念

在一次随机试验 \(E\) 中可能发生的不能再细分的结果称为基本事件(或样本输出),记作 \(\omega\)。在随机试验 \(E\) 中可能发生的所有样本输出的集合称为基本事件空间(或样本空间),记作 \(\Omega\)。一次随机试验的结果一定是基本事件空间 \(\Omega\) 中的恰好一个元素。例如:随机试验 \(E\) 是掷一次骰子,得到的点数为基本事件,则基本事件空间 \(\Omega=\{1,2,3,4,5,6\}\)

随机事件(事件)是基本事件空间 \(\Omega\) 的子集,用大写字母表示。例如:随机试验 \(E\) 是掷两次骰子,随机事件 \(A\) 为“第二次点数是第一次的两倍”,则 \(A=\{(1,2),(2,4),(3,6)\}\)

基本事件空间 \(\Omega\) 也是 \(\Omega\) 的子集,每次试验它必然发生,称为必然事件。空集 \(\varnothing\) 也是 \(\Omega\) 的子集,每次试验它不可能发生,称为不可能事件。

事件的关系和运算

\(A\) 发生必然导致 \(B\) 发生,则称 \(B\) 包含 \(A\)\(A\)\(B\) 的子事件,记作 \(A\subset B\)

\(A\subset B\land B\subset A\),则称 \(A\)\(B\) 相等,记作 \(A=B\)

定义两个事件 \(A,B\) 的和事件 \(C\)\(A\) 发生或 \(B\) 发生,记作 \(C=A\cup B\)\(C=A+B\)。类似地可以定义多个事件的和事件。

定义两个事件 \(A,B\) 的积事件 \(C\)\(A\) 发生且 \(B\) 发生,记作 \(C=A\cap B\)\(C=AB\)。类似地可以定义多个事件的积事件。

定义两个事件 \(A,B\) 的差事件 \(C\)\(A\) 发生且 \(B\) 不发生,记作 \(C=A\setminus B\)\(C=A-B\)。易知 \(A-B=A-AB\)

若两个事件 \(A,B\) 不可能同时发生,即 \(AB=\varnothing\),则称 \(A\)\(B\) 互斥(或 \(A\)\(B\) 为互斥事件,或 \(A\)\(B\) 互不相容)。

称“\(A\) 不发生”为 \(A\) 的对立事件,记作 \(\overline{A}\),即 \(\overline{A}=\Omega-A\),称 \(A\)\(\overline{A}\) 对立(或 \(A\)\(\overline{A}\) 互逆)。易知 \(A+\overline{A}=\Omega\)\(A\overline{A}=\varnothing\)\(\overline{\overline{A}}=A\)\(A-B=A\overline{B}\)

\(A_1,A_2,\cdots,A_n\) 是一组事件,若它们两两互斥,且它们的和是整个基本事件空间 \(\Omega\),则称它们是 \(\Omega\) 的一个划分,并称它们是一个完备事件组。

事件运算有以下规则:

  • 交换律:\(A+B=B+A\)\(AB=BA\)
  • 结合律:\((A+B)+C=A+(B+C)\)\((AB)C=A(BC)\)
  • 分配律:\(A(B+C)=(AB)+(AC)\)\(A+(BC)=(A+B)(A+C)\)
  • 对偶律:\(\overline{A+B}=\overline{A}\ \overline{B}\)\(\overline{AB}=\overline{A}+\overline{B}\)
  • 可以证明多个事件时上面四个运算律依然成立。

事件的频数和频率

在相同条件下,重复进行 \(n\) 次试验,事件 \(A\) 发生的次数 \(n_A\) 称为事件 \(A\) 发生的频数,\(\dfrac{n_A}{n}\) 称为事件 \(A\) 发生的频率,记作 \(f_n(A)\)

频率满足下面三条性质:

  • 非负性:\(f_n(A)\ge 0\)
  • 规范性:\(f_n(\Omega)=1\)
  • 有限可加性:若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件,则 \(f_n\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kf_n(A_i)\)

概率的统计定义和性质

在相同条件下,重复进行 \(n\) 次试验,随着试验次数 \(n\) 的增大,事件 \(A\) 发生的频率 \(f_n(A)\)\([0,1]\) 上某个值 \(p\) 附近摆动,呈现出一定的稳定性,则称 \(p\)\(A\) 在该条件下的概率,记作 \(P(A)=p\)

概率满足下面三条公理:

  • 非负性:\(P(A)\ge 0\)
  • 规范性:\(P(\Omega)=1\)
  • 可列可加性:若 \(A_1,A_2,\cdots\) 为两两互斥事件,则 \(P\left(\bigcup\limits_{i=1}^{+\infty}A_i\right)=\sum\limits_{i=1}^{+\infty}P(A_i)\)

概率满足下面的性质:

  • \(P(\varnothing)=0\)
  • 有限可加性:若 \(A_1,A_2,\cdots,A_k\) 为两两互斥事件,则 \(P\left(\bigcup\limits_{i=1}^kA_i\right)=\sum\limits_{i=1}^kP(A_i)\)
  • \(P(\overline{A})=1-P(A)\)
  • \(P(A-B)=P(A)-P(AB)\)。特别地,若 \(B\subset A\),则有 \(P(A-B)=P(A)-P(B)\)
  • \(P(A)\le 1\)
  • 广义加法公式:\(P(A+B)=P(A)+P(B)-P(AB)\)

古典概型

如果随机试验 \(E\) 满足:

  • 有限性:试验可能的基本事件有有限个。
  • 等可能性:试验中每个基本事件出现的可能性相等。

则称这种概率模型为古典概型。

对于古典概型中的事件 \(A\),设 \(n\) 为基本事件空间大小,\(m\)\(A\) 包含的基本事件个数,则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)

例如:随机试验 \(E\) 是掷一次骰子,随机事件 \(A\) 为点数不超过 \(2\),则 \(n=6,m=2\),所以 \(P(A)=\dfrac{2}{6}=\dfrac{1}{3}\)

几何概型

如果随机试验 \(E\) 满足:

  • 无限性:试验可能的基本事件有无限个。
  • 等可能性:试验中每个基本事件出现的可能性相等。

则称这种概率模型为几何概型。

对于几何概型中的事件 \(A\),设 \(n\) 为基本事件空间的测度(常为长度、角度、面积、体积等),\(m\)\(A\) 包含的基本事件的测度,则 \(A\) 的概率定义为 \(P(A)=\dfrac{m}{n}\)

例如:随机试验 \(E\) 是在一个正方形内随机选一个点,随机事件 \(A\) 为这个点在正方形的内切圆内,设正方形边长为 \(2x\),则正方形的面积为 \(4x^2\),内切圆面积为 \(\pi x^2\),所以 \(P(A)=\dfrac{\pi x^2}{4x^2}=\dfrac{\pi}{4}\)

条件概率

\(A,B\) 是两个事件,且 \(P(B) > 0\),则已知 \(B\) 发生的条件下 \(A\) 发生的概率为 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}\)

条件概率满足概率的三条公理,也是概率,因此满足概率的所有性质,另外有下列公式:

  • 乘法公式:\(P(AB)=P(A)P(B\mid A)=P(B)P(A\mid B)\)。更一般地,\(P(A_1A_2\cdots A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)\cdots P(A_n\mid A_1A_2\cdots A_{n-1})\)
  • 全概率公式:设 \(A_1,A_2,\cdots,A_n\)\(\Omega\) 的一个划分且都有正概率,\(B\) 为一个事件,由它们两两互斥知它们在 \(B\) 条件下也两两互斥,再由概率的有限可加性和乘法公式可知 \(P(B)=\sum\limits_{i=1}^nP(A_iB)=\sum\limits_{i=1}^nP(A_i)P(B\mid A_i)\)。特别地,当 \(n=2\) 时,记 \(A_1=A,A_2=\overline{A}\),则有 \(P(B)=P(A)P(B\mid A)+P(\overline{A})P(B\mid\overline{A})\)
  • 贝叶斯定理:设 \(A_1,A_2,\cdots,A_n\)\(\Omega\) 的一个划分且都有正概率,\(B\) 为一个事件且有正概率,则有 \(P(A_i\mid B)=\dfrac{P(A_iB)}{P(B)}=\dfrac{P(A_i)P(B\mid A_i)}{\sum\limits_{j=1}^nP(A_j)P(B\mid A_j)}\)

事件的独立性

若事件 \(A,B\) 满足 \(P(A)=P(A\mid B)\),则称 \(A\)\(B\) 独立。

\(A\)\(B\) 独立,由乘法公式知 \(P(AB)=P(A\mid B)P(B)=P(A)P(B)\)

反之,若 \(P(AB)=P(A)P(B)\),由条件概率知 \(P(A\mid B)=\dfrac{P(AB)}{P(B)}=\dfrac{P(A)P(B)}{P(B)}=P(A)\)

综上,\(P(AB)=P(A)P(B)\iff P(A)=P(A\mid B)\)。若 \(P(AB)=P(A)P(B)\),则 \(A\)\(B\) 独立。

若事件 \(A,B,C\) 满足 \(P(AB)=P(A)P(B)\land P(BC)=P(B)P(C)\land P(AC)=P(A)P(C)\),则称 \(A,B,C\) 两两独立。

\(A,B,C\) 两两独立,且 \(P(ABC)=P(A)P(B)P(C)\),则称 \(A,B,C\) 相互独立。

随机变量和期望

随机变量

随机变量是取值由随机事件决定的变量。

当随机变量 \(X\) 取值 \(\alpha\) 的时候,也对应着一个基本事件的集合,因此 \(X=\alpha\) 也是一个事件。

我们记 \(X\) 的取值范围为 \(I(X)\)

若随机变量 \(X,Y\) 满足 \(P((X=\alpha)(Y=\beta))=P(X=\alpha)P(Y=\beta),\forall\alpha\in I(X),\beta\in I(Y)\),则称 \(X\)\(Y\) 独立。

类似于随机事件定义两两独立和相互独立。

期望的定义

如果一个随机变量的取值个数有限(如掷骰子),或可能的取值可以一一列举出来(如正整数),则称其为离散型随机变量。

一个离散型随机变量 \(X\) 的数学期望是其每个取值乘以该取值对应概率的总和,记作 \(E(X)\)

\[E(X)=\sum\limits_{\alpha\in I(X)}\alpha P(X=\alpha)=\sum\limits_{\omega\in S}X(\omega)P(\omega) \]

其中 \(S\)\(X\) 所在概率空间的样本集合。

如果一个随机变量的取值不可列(如实数),则称其为连续型随机变量。

假设一个连续型随机变量 \(X\) 取值为 \(\xi\) 的概率为 \(p(\xi)\),则定义其期望为:

\[E(x)=\int_{-\infty}^{+\infty}xp(x)\textrm{d}x \]

条件期望

\(A\) 是事件,\(X\) 是随机变量,且 \(P(A) > 0\),则已知 \(A\) 发生的条件下 \(X\) 的期望为 \(E(X\mid A)\)

\(X,Y\) 均为离散型随机变量时,\(E(X\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha P(X=\alpha\mid Y=\beta)=\sum\limits_{\alpha\in I(X)}\alpha\dfrac{P((X=\alpha)(Y=\beta))}{P(Y=\beta)}\)

\(X\) 为连续型随机变量,\(Y\) 为离散型随机变量时,\(\displaystyle E(X\mid Y=\beta)=\int_{I(X)}\alpha f_X(\alpha\mid Y=\beta)\textrm{d}\alpha\),其中 \(f_X(*\mid Y=\beta)\) 是给定 \(Y=\beta\)\(X\) 的条件概率密度函数。

期望的性质

  • 期望的线性性:对于任意两个随机变量 \(X,Y\)(不要求独立),\(E(X+Y)=E(X)+E(Y)\)
  • 积的期望:对于任意两个独立的随机变量 \(X,Y\)\(E(XY)=E(X)E(Y)\)
  • 全期望公式:对于随机变量 \(X,Y\),由全概率公式可以证明 \(E(Y)=\sum\limits_{\alpha\in I(X)}P(X=\alpha)E(Y\mid X=\alpha)\)

一些题目

绿豆蛙的归宿

讲了那么多理论知识感觉脑壳疼,来看几道题吧。

这是一道经典期望 DP。

\({dp}_u\) 表示节点 \(u\) 走到节点 \(n\) 的路径总长度期望,初始时 \({dp}_n=0\)。考虑建反图拓扑排序来倒推。

由期望的线性性,我们可以对每条边分别计算贡献,写出转移方程:\({dp}_u=\dfrac{1}{d_u}\sum\limits_{(u,v,w)\in E}({dp}_v+w)\)。最后 \({dp}_1\) 即为答案。

[SHOI2002] 百事世界杯之旅

\({dp}_i\) 表示已有 \(i\) 个名字,要收集到 \(n\) 个名字的期望次数。

\(\dfrac{n-i}{n}\) 的概率收集到新名字,有 \(\dfrac{i}{n}\) 的概率收集不到,列出方程:\({dp}_i=\dfrac{n-i}{n}{dp}_{i+1}+\dfrac{i}{n}{dp}_i+1\)

解方程得 \({dp}_i={dp}_{i+1}+\dfrac{n}{n-i}\),代初始值 \({dp}_n=0\) 容易发现答案就是 \(n\cdot\left(\dfrac{n}{1}+\dfrac{n}{2}+\cdots+\dfrac{n}{n}\right)\)

这个输出方式太阴间了(虽说不是很难写),出题人是不会有理数取模吗。。

[六省联考 2017] 分手是祝愿

首先开关的操作是诈骗,显然可以知道最少的操作步数,因为只有第 \(n\) 个开关能控制第 \(n\) 个灯,确认了第 \(n\) 个开关是否操作后可以同理向前递推。

接下来就是另一个问题:需要操作 \(m\) 步,等概率随机操作一次会产生影响,直到需要操作步数不超过 \(k\)

我们设 \({dp}_i\) 表示从还需要操作 \(i\) 步变成还需要操作 \(i-1\) 步的期望操作次数,首先有 \(\dfrac{i}{n}\) 的概率直接进行正确操作,其次剩余的 \(1-\dfrac{i}{n}\) 的概率会错误操作,这时候需要的操作次数变为了 \(i+1\),需要先操作成 \(i\) 再操作成 \(i-1\),列出方程:\({dp}_i=\dfrac{i}{n}+\left(1-\dfrac{i}{n}\right)(1+{dp}_{i+1}+{dp}_i)\)

看着没法推,实际上把这个方程解出来问题就解决了,解得 \({dp}_i=1+\dfrac{n+(n-i)\cdot{dp}_{i+1}}{i}\)。根据题意累加一部分 \(dp\) 值即可,记得乘以 \(n!\)

posted @ 2022-06-28 12:37  rui_er  阅读(242)  评论(0)    收藏  举报