为将之道,勿以胜为喜,勿以败为忧。

\(A\cap B=\overline{\overline{A}\cup\overline{B}}\)

将试验的可能结果称为样本点,样本点的集合为样本空间,样本点需要互斥。事件是样本空间的的一个子集,当实验结果落在该子集中称为事件发生。

对于事件 \(A\)\(B\),将 \(A\cap B\) 记作 \(AB\),将 \(A\cup B\) 记作 \(A+B\)。当 \(AB=\emptyset\) 时称两者不相容。若多个事件两两不相容,则称它们互不相容。

\(P(A)\) 为事件 \(A\) 发生的概率,\(\# A\)\(A\) 所含样本点的数量,\(\#\Omega\) 为样本空间所含样本点的数量。对于有限集合,若样本点概率均等,则 \(P(A)=\frac{\# A}{\#\Omega}\),能用此刻画的模型称为古典概率模型。由此得到的关键结论是当 \(AB\) 不相容时, \(P(A+B)=P(A)+P(B)\),同时 \(P(\Omega)=1\)


古典概率模型的局限性较大,样本空间大小有限,且样本点概率均等。在现代概率论中,我们重新对事件作出定义,首先介绍测度和 \(\sigma\) 代数的概念。

首先形式化地定义可数集,这一部分对下文没有任何帮助,可以跳过。回顾抽象代数,若两个集合存在之间的双射,则称 \(AB\) 等势,记作 \(A\sim B\)\(\sim\) 是一个等价关系。记 \(N_n=\{0,1,2,\dots,n-1\}\),若 \(A\sim N_n\),则记 \(A\) 的基数 \(|A|=n\)。基数的大小关系与自然数的大小关系一致,其之间的 \(\leq\) 是一个偏序关系。若一个集合和 \(N_n\) 等势,则称其为有限集。若一个集合能与自然数集的某个子集建立双射,则称为可数集。可数的无限集称为可数无限集,与之对应的有至多可数的概念。

测度论的最初想法是对给定集合 \(X\),定义从 \(X\) 的幂集的某个子集 \(\mathcal{A}\)\([0,\infty]\) 的函数,该函数需要满足:

  • 非负性:\(\mu(A)\geq0\)
  • 空集为零:\(\mu(\emptyset)=0\)
  • 可数可加性:对可数个互不相交的集合满足可加性,注意此处可数修饰的是集合数量而非集合本身:\(\mu(\cup_{i=1}^{\infty}A_i)=\sum\limits_{i=1}^{\infty}\mu(A_i)\)

非常遗憾的是,并非所有 \(\mathcal{A}\) 都能定义合理的测度,测度论中要求测度定义在 \(\sigma\) 域上。其中 \(\sigma\) 域需要满足:

  • 包含空集和全集。
  • 对集合补封闭。
  • 对可数并封闭。

由于集合交可以被集合补和集合并表示,因此其对集合交也封闭。由此自然得到事件的定义域。相应得到概率的条件(即上文测度论的条件),注意概率还需满足完全性,\(P(\Omega)=1\)

定义 \(A-B=A\cap\overline{B}\),不难得到 \(A-B\)\(B\) 不相容。接下来给出几个概率公式:

  1. \(P(A+B)=P(A)+P(B)-P(AB)\)。根据可数可加性不难有 \(P(B-A)+P(AB)=P(B)\),同时 \(P(A+B)=P(A)+P(B-A)\),进而得到 \(P(A+B)=P(A)+P(B)-P(AB)\)
  2. \(A_1,A_2,\dots,A_n\) 均为事件,记 \(p_k=\sum\limits_{1\leq j_1<j_2<\dots<j_k\leq n}P(A_{j_1}A_{j_2}\dots A_{j_k})\),则 \(P(\cup_{i=1}^nA_i)=\sum\limits_{k=1}^n(-1)^{k-1}p_k\),与集合间的容斥相同。

对于事件 \(A_1,A_2,\dots A_n\),若 \(A_1\subset A_2\subset\dots\subset A_n\),则称 \(A_i\) 单调增,对应有 \(A_i\) 单调减。概率在单调序列上有连续性的体现,若 \(A_i\) 单调增,则:

\[P(\sum\limits_{i=1}^{\infty}A_i)=\lim\limits_{n\infty}P(A_n) \]

单调减序列类似。


\(P(B|A)\) 表示已知 \(A\) 发生的条件,\(B\) 发生的条件概率。在 \(P(A)>0\) 的情况下有计算公式:

\[P(B|A)=\frac{P(AB)}{P(A)} \]

\(P(A)=0\) 的情况是平凡的。可以利用古典概率模型给出证明。已知 \(A\) 发生,则 \(A\) 成为新的样本空间,其中 \(A\)古典概率模型(所有样本点的可能性相同),用 \(P(A)=\frac{\# A}{\#\Omega}\) 进行推导:

\(P(B|A)=\frac{\# AB}{\# A}=\frac{\frac{\# AB}{\#\Omega}}{\frac{\# A}{\#\Omega}}=\frac{P(AB)}{P(A)}\)

当然这个证明相当不严谨,因为没有说明 \(A\) 的大小有限。更加严谨的证明我并没有看懂,不知道 deepseek 什么时候能开始说人话。

从该公式自然得到概率的乘法公式:

\[P(AB)=P(A)P(B|A)=P(B)P(A|B) \]

推广到多个事件是简单的:\(P(\prod\limits_{i=1}^nA_i)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\dots P(A_n|\prod\limits_{i=1}^{n-1}A_i)\)。特别地,当 \(A_i\) 单调减,则 \(P(\prod A_i)=P(A_1)\prod P(A_i|A_{i-1})\)

若事件 \(AB\) 满足 \(P(AB)=P(A)P(B)\),则称 \(AB\) 相互独立。不可能事件、必然事件和所有事件独立。当 \(A\) 不为不可能事件时(即 \(P(A)>0\)),\(AB\) 独立当且仅当 \(P(B|A)=P(B)\)。即 \(B\) 的发生不受 \(A\) 是否发生影响。多个事件相互独立可以类似定义。

接下来设 \(A_1,A_2,\dots,A_n\) 相互独立:

1.对于 \(1\le j_1<j_2<\dots<j_k\le n\)\(A_{j_1},A_{j_2},\dots,A_{j_k}\) 相互独立。可以说明,对于 \(n\) 个独立事件,去掉任意一个事件后剩余 \(n-1\) 个事件后仍相互独立,由概率乘法公式自然得出。

2.将 \(A_i\) 分成 \(k\) 个组,每个组内部做交、并、差后,每个组仍然相互独立。

对于 \(n\) 个互不相容的事件 \(A_1,A_2,\dots,A_n\),设 \(B\subset\cap_{i=1}^n A_i\),则:

\[P(B)=\sum\limits_{i=1}^nP(A_i)P(B|A_i) \]

此之谓全概率公式。对于 \(n\) 个互不相容的事件,若 \(\cap_{i=1}^nA_i=\Omega\),则称 \(A_1,A_2,\dots,A_n\) 为完备事件组,此时全概率公式对于所有 \(B\) 都成立,不难得到 \(P(B)=P(A)P(B|A)+P(\overline{A})P(B|\overline{A})\)

继承上文的条件,当 \(P(B)>0\) ,有 Bayes 公式:

\[P(A_j|B)=\frac{P(A_j)P(B|A_j)}{\sum\limits_{i=1}^nP(A_i)P(B|A_i)} \]

进而得到:\(P(A|B)=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\)

一个文化课同学之前跟我说的问题。存在方法对于某种疾病的诊断准确率为 \(90\%\),群体中这种疾病的患病概率为 \(0.1\%\),甲被该方法判断为患病,求甲的确患病的概率。

答案

别急。

posted @ 2025-06-27 22:35  BYR_KKK  阅读(47)  评论(0)    收藏  举报