【期望】 一篇文章详细了解期望,世纪大全,深入了解期望

原文链接

期望-概率-条件概率-全概率公式-贝叶斯公式-CF

概率

我们的资料来自一下文章:

概率论03 条件概率 - Vamei - 博客园 (cnblogs.com)

知乎/7829734

概率 - 维基百科,自由的百科全书 (wikipedia.org)

概率初步 - OI Wiki (oi-wiki.org)

概率(统计学术语)_百度百科 (baidu.com)

概率论学习笔记(一) - 知乎 (zhihu.com)

概率论知识点总结 - 百度文库 (baidu.com)

直观理解贝叶斯公式 - 知乎 (zhihu.com)

全概率公式、贝叶斯公式 - 知乎 (zhihu.com)

期望经典问题入门 - Sshwy's Notes

独立性(统计学)_百度百科 (baidu.com)

我们可以看一下整理的资料:

概率需要了解几个基本概念:

1.单位事件、事件空间、随机事件

在一次随机试验 \(E\) 中可能发生的不能再细分的结果被称为 单位事件。在随机试验中可能发生的所有单位事件的集合称为 事件空间,用 \(S\)来表示。

2.性质:

  • 非负性: \(P(A) \in [0,1]\)
  • 规范性: \(P(S)=1\)
  • 可加性: \(P(A \cup B)=P(A)+P(B)-P(A \cap B)\)

3.条件概率:

\(P(A|B)\) 表示在 B 事件发生的前提下, A 事件发生的概率

我们可以发现在发生B的情况下发生A的概率与在发生A的情况下发生B的概率不同,所以我们不能混用 \(P(A|B)\)\(P(B|A)\)

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

引入

在概率公理中,我们建立了“概率测度”的概念,并使用“面积”来类比。这是对概率的第一步探索。为了让概率这个工具更加有用,数学家进一步构筑了“条件概率”,来深入探索概率中包含的数学结构。我们可以考虑生活中常见的一个估计:

三个公司开发一块地。A占地20%,B占地30%,C占地50%。三个公司规划的绿地占比不同:A土地中40%规划为绿地,B土地中的30%规划为绿地,C土地中的10%规划为绿地。我想选择绿地最大的一个小区,应该选择哪一个呢?我们可以画图出来:

显然,我们需要比较的是A:0.2x0.4,B:0.3x0.1,C:0.5x0.1。这是我们常见的一种情形:整个地区分块,每块有一定的比例。再进一步考虑每一块内部的相对比例。我们要了解的“条件概率”这一概念,就对应这里的“相对比例”。

条件概率是指事件在事件B发生的条件下发生的概率。条件概率表示为:\(P(A|B)\) ,读作“A在B发生的条件下**发生的概率”。若只有两个事件A,B,那么 \(P(A|B)=\frac{P(AB)}{P(B)}\)

拓展--全概率公式

  1. 如果事件组 \(B1,B2,....\) 满足

  2. \(B1,B2....\) 两两互斥,即 $B_i \cap B_j = ∅ $,i≠j , \(i,j=1,2,....,\)\(P(Bi)>0,i=1,2,....\) ;

2.$B1∪B2∪....=Ω $,则称事件组 \(B1,B2,...\) 是样本空间 \(Ω\) 的一个划分,设 \(B_1,B_2,...\) 是样本空间Ω的一个划分,A为任一事件,则:

\[P(A)= \sum_{i=1}^n P(B_i)P(A|B_i) \]

所以可以推出:

贝叶斯公式:

4.独立性:

直观地说,我们认为两个东西独立,当它们在某种意义上互不影响。例如,一个人出生的年月日和他的性别,这两件事是独立的;但一个人出生的年月日和他现在的头发总量,这两件事就不是独立的,因为一个人往往年纪越大头发越少。

数学中的独立性与这种直观理解大体相似,但不尽相同。

n个事件相互独立

一般地,设 \(A_1,A_2,...,A_n\) 个事件,如果对于其中任意2个,任意3个,...,任意 个事件的积事件的概率,都等于各事件概率之积,则称 相互独立

两两独立

\(A_1,A_2,...,A_n\)个事件,若其中任意两个事件之间均相互独立,则称两两独立

注: 相互独立一定两两独立、两两独立不一定相互独立。

期望

我们的资料来自一下文章:

期望值 - 维基百科,自由的百科全书 (wikipedia.org)

数学期望_百度百科 (baidu.com)

期望经典问题入门 - Sshwy's Notes

全期望公式_百度百科 (baidu.com)

CF280C # Game on Tree 期望的可加性 - jpg文字园 (acfun.ltd)

loopers期望题目感悟-期望的线性性 - yf1987 - 博客园(3条消息) 【金华集训 && 数论】 概率期望_鹭天-CSDN博客

前置了解

随机变量X:有多种可能取值的变量。

P(A):A事件发生的概率。

E(X):随机变量X的期望值,\(E(X)=\sum_i \space P(X=i)\times i\)

定义:

如果一个随机变量的取值个数有限(比如一个表示骰子示数的随机变量),或可能的取值可以一一列举出来(比如取值范围为全体正整数),则它称为 离散型随机变量

形式化地说,一个随机变量被称为离散型随机变量,当它的值域大小 有限 或者为 可列无穷大

特性:

1.独立事件:两个事件互不影响,满足 \(P(AB)=P(A)P(B),E(AB)=E(A)E(B)\)

2.期望的线性性:对于任意两个随机变量 \(X,Y,E(X+Y)=E(X)+E(Y)\)

3.全期望公式: \(E_Y=E_{[E(Y|X)]}\)

4.前缀和技巧:对于离散变量(取值只有整数)x,\(P(x=k)=P(x≤k)−P(x≤k−1)\)

5.期望计算:如果某件事的概率为P,那么其期望就为 \(\frac 1 p\)

6.期望结合律:\(E(i)x=E(i \times x)\)

提供4系例题,不要其中一种看不懂就走,跳看后面的。

例题1

eg1

有 n 个随机变量⟨Xi⟩,每个随机变量量都是从[1,m]中随机一个整数,求max⟨Xi⟩的期望。

\(S=max⟨xi⟩i=1...n\),则我们要求的是 \(E(S)\) 。根据期望的定义式得到

\[E(S)= \sum_{i=1}^m P(S=i)i \]

我们使用前缀和技巧,得到 \(P(S=i)=P(S≤i)−P(S≤i−1)\) 。然后我们推一波式子,你发现 \(S≤i\) 等价于 \(⟨xj⟩j=1n≤i\) ,那么就可以得到

\[P(S≤i)=P(⟨x_i⟩_{i=1}^{n≤i})=(\frac im)^nP(S=i)=(\frac im)^n−(\frac{i−1}{m})^n \]

于是得到

\[E(S)= \sum_{i=1}^m i((\frac im)^n−(\frac{i−1}{m})^n)=m−\frac 1{m^n} \sum_{i=1}^{m−1}i^n \]

eg2

CF280C Game on Tree

题目描述

给定一棵有根树,结点编号从 1 到 n。根结点为 1 号结点。

对于每一次操作,等概率的选择一个尚未被删去的结点并将它及其子树全部删去。当所有结点被删除之后,游戏结束;也就是说,删除 1 号结点后游戏即结束。

要求求出删除所有结点的期望操作次数。

我们可以发现本题求的是删除总次数的期望,而根本无法直接求出,简单转换为求出每一个点的期望选择次数并且累和,即:

\[del(all \space tree)= \sum_{i=1}^{n} P(i) \]

我们可以想象成无论一个点是否删除它都存在在一个包含了所以点的序列上,所以一个点被删除当且仅当它在所以他的祖先节点后面,所以选择成功的概率为$ \frac{1}{dep(i)}\qquad$

eg3

箱子里有n个球1,2,⋯,n,你要从里面拿m次球,拿了后不放回,求取出的数字之和的期望。

我们设随机变量 \(x_i\) 表示

设答案为S,得到\(S= \sum_{i=1}^n x_i\),于是我们要求

\[E(S)=E(\sum_{i=1}^nx_i)\sum_{i=1}^nE(xi) \]

展开 \(E(x_i)\) 得到

\[E(x_i)=\sum_j P(x_i=j)j=P(x_i=i)i \]

显然 \(P(x_i=i)\) 表示i被取出的概率。而拿球后不放回,相当于在 n 个球中取 m 个,因此概率为nm,于是得到

\[E(x_i)=\frac mn\times i \]

\[E(S)=\sum _{i=1}^n \frac mn⋅i= \frac {m(n+1)}2 \]

eg4

箱子里有n个球1,2,⋯,n,你要从里面拿m次球,拿了后以p1的概率放回,p2的概率放回两个和这个相同的球(相当于增加一个球),求取出的数字之和的期望。


然后我们考虑求 \(E(yi)\) 。首先我们知道,每一个球是平等的,意味着概率是均等的,意味着它们被拿出来的次数的期望是一样的,即 \(E(y_1)=E(y_2)=⋯=E(y_n)\) 。而我们知道,他们被拿出来的次数的和是m(因为你只拿了m个球出来),而 \(E(m)=m\) ,即 \(E(\sum_{i=1}^ny_i) \sum_{i=1}^n E(y_i)=m\)

因此得到 \((y_i)= \frac mn\) ,带回上式得到\(E(S)=\sum _{i=1}^n \frac mn⋅i= \frac {m(n+1)}2\)

例题2

eg1

在一条n个点的链上游走,求从一端走到另一端的期望步数。

eg2

在一个n个点的完全图上游走,求从一个点走到另一个点的期望步数。

显然,这是一张完全图,每一个点都连接出去了n-1条边,所以对于一个点,从它走向另一个点的概率为 \(\frac 1 {n-1}\) ,根据性质5,即可得到期望为n-1。

或:

设期望步数为E

  • g非目标点

  • f目标点

    所以每一次有 \(\frac{n-2}{n-1}\) 的概率走到非目标点,\(\frac1{n-1}\) 的概率走到目标点。

所以可以得到:

\[E=\frac{n-2}{n-1}E+1 \]

\(E=n-1\)

eg3

在一个n个点的完全二分图上游走,求从一个点走到另一个点的期望步数。

我们设A :一个点到达同侧点的期望步数。
B :一个点到达异侧点的期望步数,很显然得到:
\(B= \frac n 1* 1+\frac{n-1}n*(A+1)\)(一个点直接走到异侧点 && 一个点先到达异侧点后按照同侧点的走法)
A : 1 + B(先走到异侧点,后按照异侧点的走法)
解方程即可得到答案

eg4

在一个n个点的菊花图上游走,求从一个点走到另一个点的期望步数。

考虑菊花图的特殊性,菊花图分为两个部分:中心以及叶子,我们对这两个部分进行讨论:

概率
叶子 叶子 A
叶子 中心 1
中心 叶子 B

对于第二个讨论很显然就是一步,关键就是对A和B的讨论
对于叶子都走到叶子,可以先由叶子都到中心,再有中心走到叶子:
即A=1+B
对于中心走到叶子,可能是直接走到叶子,也可能是走到其他叶子在执行A,即:

\[\frac 1{n-1} \times 1+\frac{n-2}{n-1} \times (1+A) \]

解方程即可

eg5

在一棵n个点的树上游走,求从根走到x的期望步数。

对每条边 \((u \to v)\) 记录从u走到v的期望步数。Su表示u的儿子数(有根树)

屏幕截图 2021-10-19 140014

v当作u的父节点,那么v′一定是u的子节点。

dp设计:

从根到子节点算一下向下走的边的期望。这题本来可以直接 \(f(u)\) 表示从u走到u的父节点的期望步数来 DP,但上述方法可以支持多组询问。

例题3

eg1

P4550 收集邮票 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)

每次随机一个[1,n]的整数, 问期望几次能凑齐所有数(是上面题目简化版)。

考虑期望的线性性,就是 \(E=\sum E(i)\) ,其中E为所求,\(E(i)\) 为在已经取出i-1个数字时,取到第i个数字的期望。根据之前整理过的内容,“特性5发生概率为p的事件,在期望 \(\frac{1}{p}\) 次之后会发生”,我们可以得到如下:

\[\begin{aligned} P(i)& =\frac{n-(i-1)}{n} \\ E(i)& =\frac{1}{P(i)}=\frac{n}{n-i+1} \end{aligned} \]

然后把他们加起来就是

\[E=\sum\frac{n}{n-i+1}=\sum\frac{n}{i} \]

solution:

\(f[i]\)表示现在取到i张邮票,要取完剩下邮票的期望次数 显然 \(f[n]=0\) 现在已经取得i张邮票,所以下一次取邮票有\(\frac{i}{n}\)的概率取到已经有的,期望为 \(\frac{n-i}{n}f[i]\) 的概率取到没有的,期望为 \(\frac{n-i}{n}f[i+1]\) ,这次取邮票的期望为1,所以总期望为:

\[f[i]= \frac nif[i]+ \frac n{n−i} \times f[i+1]+1 \]

\(g[i]\)是考虑权值的答案数组,表示取了i个的期望答案:

有式子:

\[g[i]= \frac{i}{n}*(g[i]+f[i]+1)+ \frac{n-i}{n} \times (g[i+1]+f[i+1]+1) \]

g分成两个来看,前者是选择了已经选择的为\(\frac{i}{n}*(g[i]+f[i]+1)\),后者为 \(\frac{n-i}{n} \times (g[i+1]+f[i+1]+1)\) ,表示选择了未选择的,所以我们可以知道本次的完成是在第 \(f[i]+1\) 次。

eg2

随机一个长度为n个排列p,求 \(⟨{p_j⟩=}_{j=1}^i\)\(p_i\) 是最大的数的概率。

其实这题很简单。由于每个数是均等的,因此他们成为最大值的概率也是一样的,于是答案为 \(\frac 1i\)

eg3

给定一棵树,将他的边随机一个顺序后依次插入,求u,v期望什什么时候连通。

那么我们只需要考虑在插入边的序列中,u,v路径上出现时间最晚的边的位置(位置即时间)的期望。

假设 u,v 路径长度为 k ,总边数是 n−1,那么枚举最后一条边的位置 i,那么首先我们考虑剩下 k−1 条边的选法,然后是这 k 条边的顺序,然后是剩下的n−k−1条边的顺序(总共n−1条边),最后除以全排列即可。

\[\frac{ \sum_{i=k}^{n-1}k!\begin{pmatrix} i-1\\ k-1 \end{pmatrix}(n-k-1)!}{(n-1)!} \]

例题4

eg1

给出一棵树, 一开始每个点都是白的, 每次选一个白点将他子树里所有点染黑,求期望几次染黑整个树。

前面提到过,染黑相当于删除,问题转化为每个点在它到根的路径上的点集中最先被删的概率,答案为

\[del(all \space tree)= \sum_{i=1}^{n} dep(i) \]

eg2

有N个数\(⟨a_i⟩_{i=1}^n\),每次等概率选出两个数,然后合并成一个新的数放回来,得到的收益是新的数的值,求总收益的期望。

我们设随机变量 \(x_i\) 表示 \(a_i\) 对答案的贡献次数,显然收益为 \(\sum_{i=1}^n a_i\)。一波套路转化为求 \(E(x_i)\) 。要求期望的贡献次数,就是求期望的合并次数。每次合并都会减少一个数,所以在剩下的k个数中选择2个选中的概率\(\frac2k\)

所以:

\[E(S)= \sum_{i=1}na_i\sum_{j=1}^{n-1} \frac{2}{n-j+1} \]

现在做后

我们可以发现期望的规律,就是跳出思考,优先理解题目,考虑善于利用随机变量计算。

posted @ 2021-10-19 11:24  yf1987  阅读(443)  评论(0)    收藏  举报