03-1概率论与数理统计-基本概念、各种概率计算方法
概率论与数理统计是研究随机现象规律性的数学分支
基本概念
样本空间
样本空间是概率论中的基础概念,指一个随机试验中所有可能结果的集合。它是定义概率模型的基础框架,用于描述随机现象的所有潜在结果。
1. 基本定义
- 符号表示:通常用 或 表示。
- 元素:样本空间中的每个结果称为样本点(Sample Point),记作 。
- 核心要求:
- 互斥性:任意两个样本点不能同时发生。
- 完备性:包含所有可能结果,无遗漏。
2. 示例
随机试验 | 样本空间 | 样本点示例 |
---|---|---|
抛一枚硬币 | 正面、反面 | |
掷一颗骰子 | 点数为1、2、3、4、5、6 | |
记录某日降雨量(mm) | 任意非负实数(如0、5.3、100) | |
两次抛硬币的结果 | (正面,反面)、(反面,正面)等 |
3. 分类
根据结果的可数性,样本空间分为两类:
(1) 离散样本空间
- 特点:结果可数(有限或无限可列)。
- 示例:
- 有限:骰子点数 。
- 无限可列:某客服中心一天接到的电话次数 。
(2) 连续样本空间
- 特点:结果不可数,充满某个区间。
- 示例:
- 测量某物体的长度(单位:米):。
- 某地区一天的温度变化:(摄氏度)。
4. 事件(Event)与样本空间的关系
- 事件:样本空间的子集,表示某些结果的集合。
- 基本事件:仅包含一个样本点(如骰子点数为3)。
- 复合事件:包含多个样本点(如骰子点数为偶数 )。
- 必然事件:整个样本空间 ,概率为1。
- 不可能事件:空集 ,概率为0。
6. 常见误区与注意事项
- 误区:混淆样本空间与事件空间。
- 纠正:样本空间是全体结果,事件空间是其子集的集合(即σ-代数)。
7. 总结
- 核心作用:为概率模型提供所有可能结果的定义域。
随机事件
随机事件是概率论中描述可能发生或不发生的结果集合的核心概念,是样本空间的子集。
1. 基本定义
- 数学定义:随机事件是样本空间 的子集,记为 。
- 发生条件:当试验结果 时,称事件 发生。
- 分类:
- 基本事件:仅含一个样本点的事件(如骰子点数为3)。
- 复合事件:由多个样本点组成的事件(如骰子点数为偶数)。
- 必然事件:(概率为1)。
- 不可能事件:空集 (概率为0)。
2. 事件的集合运算
通过集合操作可组合事件,对应概率的逻辑关系:
运算 | 符号 | 定义 | 概率意义 |
---|---|---|---|
并(或) | 或 | 至少有一个事件发生。 | |
交(与) | 且 | 两个事件同时发生。 | |
差(非) | 且 | 事件A发生但B不发生。 | |
补(对立) | 事件A不发生。 |
3. 事件的关系
关系 | 定义 | 示例 |
---|---|---|
互斥(互不相容) | 抛硬币得“正面”和“反面”是互斥事件。 | |
独立 | 两次独立抛硬币的结果相互独立。 | |
包含 | → 发生必导致 发生 | 骰子点数为2的事件包含于“点数小于3”。 |
事件的独立性
给定A、B两个事件,如果概率存在P(A,B)=P(A)P(B)(A、B事件的联合分布概率等于事件各自分布概率的积),则事件A和B相互独立。如果事件A、B相互独立,互不影响,那么存在P(A|B)=P(A),P(B|A)=P(B)。
例1 袋中装有 4 个外形相同的球,其中三个球分别涂有红、白、黑色,另一个球涂有红、白、黑三种颜色.现从袋中任意取出一球,令:
A={ 取出的球涂有红色 }
B={ 取出的球涂有白色 }
C={ 取出的球涂有黑色 }
则:
这表明,A、B、C这三个事件是两两独立的,但不是相互独立的.
频率与概率
频率与概率是统计学中描述随机现象发生可能性的两种核心概念,分别对应实际观测结果与理论预期值。以下是两者的系统解析与对比:
1. 基本定义
概念 | 定义 | 数学形式 |
---|---|---|
频率 | 在有限次试验中,某事件发生的次数与总试验次数的比值。 | 。 |
概率 | 描述事件发生的理论可能性,通常基于模型假设或公理化定义。 | ,满足概率三公理。 |
2. 核心区别
维度 | 频率 | 概率 |
---|---|---|
性质 | 基于实际观测,随试验结果变化。 | 理论值,固定不变(假设模型正确)。 |
依赖条件 | 依赖具体试验数据。 | 依赖概率模型的定义(如均匀分布、正态分布)。 |
稳定性 | 试验次数较小时波动较大。 | 恒定值(如硬币正面的概率恒为0.5)。 |
极限关系 | 当试验次数 ,频率趋近概率(大数定律)。 | 概率是频率的极限。 |
概率是频率的稳定值。
独立试验
重复独立试验:在相同的条件下,将试验E重复进行,且每次试验是独立进行的,即每次试验各种结果出现的概率不受其他各次试验结果的影响。
n重伯努利试验:若一试验的结果只有两个A和Ā, 在相同的条件下, 将试验独立地重复进行n次, 则称这n次试验所组成的试验为n重复伯努利试验或伯努利概型。
简单随机抽样
抽取的样本满足两点:
(1)样本X1,X2...Xn是相互独立的随机变量。
(2)样本X1,X2...Xn与总体X同分布。
联合分布函数:
联合概率密度:
排列数
从m个不同元素中取出n(n ≤ m)个元素(被取出的元素各不相同),并按照一定的顺序排成一列(一般顺序是抽取出来的顺序),叫做从m个不同元素中取出n个元素的一个排列。记作:A(m,n)
案例:
在一个盒子中有十个完全相同的球,其中每个球上编有一个编号,球的编号从0到9,求随机抽取3个球,可能出现的数字序列共有多少种?(备注:考虑数字的顺序,认为1、2、3和3、2、1是不一样的)。
总共10个球,抽取3个球的排列数:
第一步:从10个球中,获取一个球,有10种选择方式
第二步:从剩下的9个球中,获取一个球,有9种选择方式
第三步:从剩下的8个球中,获取一个球,有8种选择方式
合并这3步,就共有10 * 9 * 8种选择方式,即:
组合数
从m个不同元素中取出n(n ≤ m)个元素的所有组合的个数,叫做从m个不同元素中取出n个元素的组合数。记作:C(m,n)
案例:
在一个盒子中有十个完全相同的球,其中每个球上编有一个编号,球的编号从0到9,求随机抽取3个球,可能出现的数字组合共有多少?
(备注:不考虑数字的顺序,认为1、2、3和3、2、1是一样的)。
总共10个球,抽取3个球的组合数:
- 抽取3个球的排列数为A(10, 3)
- 对于任意排列(a1 ,a2 ,a3 )都有3*2*1种相同元素的排列存在
- 其实组合就是在排列的基础上去掉相同元素后剩下的数量
即:
古典概率
概率是以假设为基础的,即假定随机现象所发生的事件是有限的、互不相容的,而且每个基本事件发生的可能性相等。一般来讲,如果在全部可能出现的基本事件范围内构成事件A的基本事件有a个,不构成事件A的有b个,那么事件A出现的概率为:
概率体现的是随机事件A发生可能的大小度量(数值)。
案例:
在一个盒子中有十个完全相同的球,其中五个黑球,五个白球,求事件A={从盒子中获取一个球,颜色是黑色}的概率。
基本的事件总数:10
抽取一个球是黑球的事件数:5
案例:
假设有n个人,每个人都等可能地被分配到N个房间中的任意一间去住(n≤N),求事件A={恰好有n个房间,其中各住一个人}的概率。
- 每个人有N个房间可供选择,所以n个人住的方式共有Nn种。
- 恰好n个房间表示这n个房间其实是从N个房间中任意抽取出来的,也就是从N个房间中抽取n个方法的组合总共有C(N,n)种。
- 对于n个房间来讲,n个人平均分配,那么总共有A(n,n)种入住方式。
生日问题:
某个班级有n个学生(n≤365),问至少有两个人的生日在同一天的概率有多大?
联合概率
表示两个事件共同发生的概率,事件A和事件B的共同概率记作:P(AB)、P(A,B)或者P(A∩B),读作“事件A和事件B同时发生的概率”
- 独立事件:。例如多次抛硬币。
- 依赖事件: 或 。
- 条件概率公式:当 和 不独立时,必须通过条件概率计算 。
- 直观理解: 是 发生的概率乘以在 已发生时 的条件概率。
- 特殊关系:
- 互斥事件:;
- 包含关系: 或 。
条件概率
事件A在另外一个事件B已经发生的条件下的发生概率叫做条件概率,表示为P(A|B),读作“在B条件下A发生的概率”
一般情况下P(A|B)≠P(A),而且条件概率具有三个特性:
- 非负性
- 可列性
- 可加性
例 1 两台车床加工同一种零件共100个,结果如下
合格品数 |
次品数 |
总计 | |
第一台车床加工数 |
30 |
5 |
35 |
第二台车床加工数 |
50 |
15 |
65 |
总 计 |
80 | 20 | 100 |
设 A={ 从100个零件中任取一个是合格品}
B={从100个零件中任取一个是第一台车床加工的 }
求:P(A),P(B),P(AB),P(A|B)
注意,P(AB)≠P(A)*P(B);而是等于P(A)*(30/80)
例2 已知某家庭有3个小孩,且至少有一个是女孩,求该家庭至少有一个男孩的概率
解:设 A={ 3个小孩至少有一个女孩 }
B={ 3个小孩至少有一个男孩 }
将条件概率公式由两个事件推广到任意有穷多个事件时,可以得到如下公式,假设A1,A2,....,An为n个任意事件(n≥2),而且P(A1A2 ...An )>0,则:
P(A1A2 ...An)=P(A1)P(A2|A1)...P(An|A1A2...An-1)
例3 袋中有一个白球与一个黑球,现每次从中取出一球,若取出白球,则除把白球放回外再加进一个白球,直至取出黑球为止.求取了n 次都未取出黑球的概率.
例 4 设某光学仪器厂制造的透镜,第一次落下时打破的概率为 1/2 ,若第一次落下未打破,第二次落下打破的概率为 7/10 , 若前两次落下未打破,第三次落下打破的概率为 9/10 。求透 镜落下三次而未打破的概率。
解:以 Ai ( i=1,2,3 ) 表示事件“透镜第 i 次落下打破”,以 B 表 示事件“透镜落下三次而未打破”,
有:
全概率公式
全概率公式用于计算复杂事件概率,通过将事件分解为互斥且穷尽的情况来简化计算。
公式定义
设事件 构成样本空间的一个划分(即互斥且穷尽),且
(例如把365天划分成星期几,那么某一天不可能同时属于星期一又属于星期二)
则对任意事件 ,有:
核心思想
- 分解复杂事件:将事件 分解为多个互斥场景 下的条件概率。
- 加权求和:每个场景的概率 乘以该场景下 发生的条件概率 ,最后累加得到总概率。(发生A的概率乘以在发生A的条件下发生B的概率即)
应用步骤
- 确定目标事件 :明确需要计算概率的事件。
- 构造划分事件 :确保这些事件互斥且覆盖所有可能。
- 计算每个 的概率:。
- 计算条件概率:针对每个 ,求 。
- 代入公式求和:将所有 相加。
经典示例
示例1:产品质量检测
- 场景:两个工厂生产产品,工厂A占60%,次品率1%;工厂B占40%,次品率2%。求随机抽取一件是次品的概率。
- 解:
- 划分事件:(来自工厂A),(来自工厂B)。
- 计算:
示例2:不放回抽球
- 场景:袋中有3红球和2蓝球,不放回抽两次,求第二次抽到红球的概率。
- 解:
- 划分事件:(第一次抽红球),(第一次抽蓝球)。
- 计算:
例5 某小组有20名射手,其中一、二、三、四级射手分别为2、6、9、3名.又若选一、二、三、四级射手参加比赛, 则在比赛中射中目标的概率分别为0.85、0.64、0.45、0.32, 今随机选一人参加比赛,试求该小组在比赛中射中目标的概率.
扩展与注意事项
无限划分:当划分事件为可数无限个时,公式可推广为:
与贝叶斯定理的关系:全概率公式常用于计算贝叶斯定理中的分母 ,例如:
验证划分的正确性:确保 互斥且穷尽,避免遗漏或重叠。
总结
全概率公式通过分解复杂事件为互斥的简单场景,简化了概率计算。其核心在于正确构造划分事件并准确计算每个部分的概率。这一工具在统计推断、风险评估和决策分析中具有广泛应用。
一座房子在过去20年里一共发生过2次被盗案,房子的主人养了一条狗,狗平均每周晚上叫3次,在盗贼入侵时狗叫的概率估计为0.9,请求:在狗叫的时候发生入侵的概率是多少?
医学诊断
- 问题:已知某疾病患病率为 ,检测准确率为 (患病者 阳性,健康者 阴性)。若某人检测为阳性,求实际患病的概率。
- 解:
- 设 为患病, 为检测阳性。
- 根据贝叶斯公式:
结论:检测为阳性时,患病概率仅为 ,体现了先验概率的重要性。
例 6 用某种方法普查肝癌,设: A={ 用此方法判断被检查者患有肝癌 }, D={ 被检查者确实患有肝癌 },
已知
而且已知:P(D)=0.0004
现有一人用此法检验患有肝癌,求此人真正患有肝癌的概率