概率期望
概率论
基本概念
样本空间 $\Omega $:随机现象所有可能出现的结果。元素称之为样本点。
随机事件:样本空间的一个子集。称一个随机事件发生了当且仅当其内部的某一样本点发生了。
随机事件是子集,我们称 \(A\) \(B\) 两事件的交是 \(AB\),意指同时发生;并是 \(A+B\) 意指分开发生。
事件域 $\mathcal{F} $:我们关心的随机事件。
一般来讲,$\mathcal{F} $ 还需要满足有逆元(这里是补集)、对集合并呈封闭性两个特点。
显然这个定义使得其对集合交也呈封闭性。
概率 \(P\):事件发生的可能性大小。
古典定义(古典概型):如果 $\Omega $ 内的样本点等可能发生,则随机事件 \(A\) 发生的概率 \(P(A)=\frac{|A|}{|\Omega|}\)。
几何概型:若样本点无限等可能发生,则随机事件 \(A\) 发生的概率就是 \(A\) 所代表的几何大小与 $\Omega $ 所代表的几何大小之比。
公理化定义:满足以下条件的函数 \(P\) 称为概率。
- \(P:\mathcal{F}\longrightarrow [0,1]\)
- \(P(\Omega)=1\)
- 对于不交集合 \(A_i\),有 \(P(\bigcup A_i)=\sum P(A_i)\)。
概率函数的性质:
- 单调性:\(A\subset B\to P(A)\le P(B)\)
- 容斥原理:\(P(A+B)=P(A)+P(B)-P(AB)\)
- \(P(A-B)=P(A)-P(AB)\)
称 \((\Omega,\mathcal{F},P)\) 为一个概率空间。
条件概率
条件概率:在某个事件发生的情况下另一事件发生的概率。称 \(B\) 在 \(A\) 发生下的概率为 \(P(B|A)\)。
对于所有 \(A\in\mathcal{F}\),我们都可以定义在 \(A\) 发生下的概率 \(P(\cdot|A)\):
容易证明这可以作为一个概率函数。
概率乘法公式:\(P(AB)=P(A)P(B|A)\) 由定义立得。
全概率公式:对于 \(\Omega\) 的一个划分 \(A_i\),对于任意事件 \(B\),有:
显然。
贝叶斯公式:对于事件 \(B\) 和事件 \(A\) 有:
对于 \(B\) 事件和 \(\Omega\) 的一个划分 \(A_i\),有:
独立性:称 \(A\),\(B\) 独立当且仅当 \(P(AB)=P(A)P(B)\)。
定义式可以由条件概率给出:
随机变量
随机变量:若函数 $X:\Omega\longrightarrow \mathbb{R} $ 满足对于任意 $t\in\mathbb{R} $ 有
则称 \(X\) 为随机变量。
容易发现当 \(\mathcal{F}=2^{\Omega}\) 时,任意 \(X\) 都可以称为随机变量。
感性理解下,随机变量其实就是为每个事件赋权。上面要求满足的条件等价于对于任意不超过权值的部分都有概率与之对应。
基于随机变量,可以提出一种新的概率符号:
\(\{x=a\}\):所有 \(\{\omega|X(\omega)=a\}\)
\(P\{x=a\}\) 或 \(P(x=a)\):表示 \(P(\{x=a\})\)。
这里的 \(x\) 用于表示一种 \(X(\omega)\),是一种对带权样本的特殊表示。有的时候我们也会直接使用 \(X\) 表示 \(x\),联系上下文区分。
这里我再给出一些随机变量的计算法则:
随机变量的加法:\((X+Y)(\omega)=X(\omega)+Y(\omega)\)
随机变量的数加:\((X+a)(\omega)=X(\omega)+a\)
随机变量的数乘:\((aX)(\omega)=a(X(\omega))\)
随机变量的乘法:这个比较特殊,我记录一下自己的理解,可能是错的。
知周所众,随机变量被用来数值化样本。
那两个随机变量的乘法,就应该看作一种新的随机变量。
设 \(X\) 是基于 \((\Omega_X,\mathcal{F}_X,P_X)\) 的随机变量,\(Y\) 是基于 \((\Omega_Y,\mathcal{F}_Y,P_Y)\) 的随机变量,那么随机变量 \(XY\) 应该是基于 \((\Omega_X\times \Omega_Y,\mathcal{F}_X\times\mathcal{F}_Y,P_{XY})\),满足 \(P_{XY}((\omega_X,\omega_Y))=P_X(\omega_X)P_Y(\omega_Y)\),并有 \(XY((\omega_X,\omega_Y))=X(\omega_X)Y(\omega_Y)\)。
这种表示将样本和权值进行了完全绑定。
我感觉只要这样定义才可以解释下面的期望乘法式。
示性函数:对于事件 \(A\),定义随机变量
称 \(I_A\) 为 \(A\) 的示性函数。
可以理解为对一个样本是否可以使事件发生所带的权。
分布函数:对于随机变量 \(X\),若有
则称 \(F\) 是 \(X\) 的分布函数,记作 \(X\sim F\)。
分布函数具有以下性质:
- 单调性:在 $\mathbb{R} $ 上非严格单调递增。
- \(F(-\infty )=0,F(+\infty )=1\)
- 随机变量 \(X\) 和分布函数 \(F\) 构成双射。
离散型随机变量:取值有限或无限可列为 \(x_i\),则可以由 \(p_i=P(x=x_i)\) 描述。又称分布列。
连续型随机变量:无限不可列但是处处连续的随机变量 \(X\)。
对于 \(X\sim F\),有:
随机变量取任意值的概率为 \(0\),不能直接使用。不难想到用:
表示 \(x=a\) 时的概率值,于是
则称 \(f\) 为 \(X\) 的密度函数。
随机变量的独立性:若对于随机变量 \(X\) 和 \(Y\) 满足:
则称 \(X\) 与 \(Y\) 独立。
随机变量的数学特征
期望:对于随机变量 \(X\) 的期望 \(E(X)\),分为两类进行定义。
离散型随机变量的期望:
连续型随机变量的期望:
期望具有线性性。
- \(E(aX+b)=aE(X)+b\)
- \(E(X+Y)=E(X)+E(Y)\)
常见使用是直接将 \(E\) 从最外层套到加法和乘法的每一项上。
值得一题的是,正因线性性,期望也可以有 min-max 反演。
若 \(X\) 和 \(Y\) 独立,有 \(E(XY)=E(X)E(Y)\)。
由我上面对 \(XY\) 的定义不难证明。
概率转期望:使用示性函数可以有 \(E(I_A)=P(A)\)。
由于期望的一些特殊性质,会更好计算。
条件期望:不多赘述,就是基于另一随机变量取值的随机变量的期望。
常见写法是 \(E(X|y)\)。
全期望公式:\(E(E(X|Y))=E(X)\)。
至此,常用的一些概率期望的概念就都处理完了。
习题
P5104 红包发红包
连续型随机变量的期望需要借助密度函数。
接下来把它积回去。
那么一次 \(w\) 的期望就可以算了。
多次的话,考虑期望倒着设:\(E(X_k)\) 表示取完第 \(k\) 次以后剩余的期望。
由 \(X_0=w\) 立得答案为 \(\frac{w}{2^k}\)(最后一次反正都是除以 \(2\) 答案当然和剩余的一样了)。
P3750 [六省联考 2017] 分手是祝愿
首先求出初始局面的最小操作数与哪些位置需要操作。显然,最小操作集合唯一。
换句话说,你在最小操作集合上加操作一定不会使操作变优,只有删操作才会有贡献。
这是本题最重要的性质,接下来只需要考虑这样一个问题:给你一个集合,每次有概率加数和删数,求它大小变成 \(k\) 的期望步数。
不妨设上述概率为 \(f_i\),于是有 \(f_k=0\)。
考虑 \(f_i\)。要么是从高的删过来,要么是从低的转过去。\(f_i=\frac{i}{n}f_{i-1}+\frac{n-i}{n}f_{i+1}+1\)
同样的,由于 \(n\) 不能再上了,所以 \(f_n=f_{n-1}+1\)
然后就是喜闻乐见的解方程环节。
P6835 [Cnoi2020] 线形生物
直接尝试解方程。
CF865C Gotta Go Fast
考虑倒着设,\(f_{i,j}\) 表示还有 \(i\) 关 \(j\) 时间。
你会发现最后都和 \(f_{n,m}\) 有关。
考虑设一个常数 \(c\) 代替 \(f_{n,m}\) 作为 \(\text{chkmin}\) 计算。不难看出 \(c\) 和 \(f_{n,m}\) 的差距会随着实际距离变小。
CF908D New Year and Arbitrary Arrangement
考虑如果知道前面 \(a\) 的期望个数,那这个位置插入 \(b\) 的期望贡献就很明显了。
\(f_{i,j}\) 表示 \(i\) 个 \(a\) 造成了 \(j\) 个 \(ab\) 子序列的概率。
理论上的转移:\(f_{i+1,j}=paf_{i,j}\) 和 \(f_{i,j+i}=pbf_{i,j}\)。
那么最后求的就是所有 \(j\ge k\) 的 \(j\) 期望。
如果 \(j+i\ge k\),就应该直接去考虑了,因为这时但凡来一个 \(b\) 就通了。
相当于是求 \(pb\sum_{k=0}pa^k(j+i+k)\)
后面那一坨推出来是 \(S=\frac{j+i+\frac{pa}{1-pa}}{(1-pa)}\)。
CF1156F Card Bag
相当于是说抽一个最后一位相等的上升序列。
排序去重,设 \(f_i\) 表示前面一起选到 \(i\) 的概率。求这玩意直接枚举上一项算即可。
不太行,这样需要设两维。
将思路逆转过来,我们设 \(f_i\) 表示算前面的数总共选了 \(i\) 个数的概率。
这时考虑当前的数,就只需要考虑连续选两个的概率了。
CF1264C Beautiful Mirrors with queries
给你一条链,每个点有返祖边,返祖边是一段一段的。求随机游走到 n+1 的期望。返祖边段会修改。
结合上面的柿子,我们有一个不修改的做法:用矩阵连乘推系数,用下一段的值推这一段的值。
不难注意到不管是系数还是段之间的贡献,都是一次函数,即有结合律。
平衡树维护 ODT,反推系数即可。

浙公网安备 33010602011771号