新文章 网摘 文章 随笔 日记

概率分布函数、概率密度函数

文章转自:

https://zhuanlan.zhihu.com/p/266435689

 

如果你的概率论学的比较好,相信对概率函数、概率分布,概率分布函数、概率密度函数等函数应该是比较熟悉的啦,像我这种学渣,还是老实记录学习笔记,做好总结...

概率论的两个基石函数:概率分布函数、概率密度函数.

1.随机变量

讲解概率分布函数、概率密度函数之前,我们首先介绍一下随机变量,随机变量又可根据数值的不同,分为两类:离散型随机变量和连续型随机变量.

图1 随机变量的分类

如何区分离散型随机变量和连续型随机变量,在贾俊平老师的《统计学》教材中,给出了这样的区分:

如果随机变量X的值可以逐个列举出来,则X为离散随机变量;如果随机变量X的值无法逐个列举,则X为连续随机变量.

进一步解释:

离散型随机变量是指其数值只能由自然数或整数单位计算,例如:企业个数、员工人数、设备台数等等,其数值一般由计数方法取得. 反之,在一定区间内,可任意取值的变量叫连续随机变量,其数值是连续不断的,相邻两个值之间可无限分割,即可取无限个值. 例如:生产零件的规格尺寸、人的身高、人的体重等等. 其数值只能由测量或计量的方法取得.

形象解释:

如下图2所示:左边是梯子,右边是:斜坡

像梯子一样能说出多少层的,可描述为离散型随机变量;
像斜坡一样不能说出多少层的,可描述为连续型随机变量.

注:实际操作中,梯子的阶高可能很小,看起来很像斜坡,需要放大看.

图2 梯子与斜坡

 

2.离散型随机变量的概率函数、概率分布、分布函数

① 概率函数

概率函数,顾名思义,用函数的形式来表达概率:

��=�(X=��) ,其中: ,,,,,�=1,2,3,4,5,6
其中自变量 X 是随机变量的取值,因变量 �� 是自变量取相应值的概率,所以顺理成章就称为自变量 X的概率函数,从上面式子可算出,概率函数一次只能一个取值的概率,比如 �(X=1)=16 ,表示当自变量 X=1 时的概率为 16 .

② 概率分布

概率分布,顾名思义,就是概率的分布,还是讲的"概率",不过侧重点在于"分布",为便于理解,我们来看一张图:

图3 离散型随机变量的值及概率分布列表

在很多书中,上面的列表叫做离散型随机变量的 "概率分布",其实严格意义来说,应该叫做"离散型随机变量的值分布和概率分布". 名字虽长了一点,但有利于我们更好的理解.

注:上面的列表,需要列出自变量所有可能的取值及对应的概率.

举例:一颗具有6面的骰子,每一个面对应的数字为1,2,3,4,5,6,随机摇骰子,每一个数字出现的概率都为 1/6,你说下面的列表是骰子取值的概率分布吗?

图4 判断是否为概率分布

分析:上面是骰子的取值,下面是取值所对应的概率,看起来,好像就是概率分布啊,其实大错特错,骰子的取值要包括:所有可能的取值,上面的取值漏掉了 6 .

③ 分布函数

分布函数又是个什么东东,其实它的全名叫做:概率分布函数.

我们来讲一下它的定义:

设离散型随机变量的分布律是: ,,,,��=�(�=��),�=1,2,3,...
则 �(�)=�(X⩽�)=∑��⩽��� ,由于 � 是取 ⩽� 的 诸值�� 的概率之和,
故又称是 累积概率函数.

其实上面定义所讲的"分布律"就是我们前面所说的 "概率函数"

如果你仔细推敲 "概率分布函数" 的定义,就会发现它就是概率函数中的概率累加的结果,所以它又叫做"累积概率函数".

概率函数与概率分布函数其实就是一个硬币的两面,只是用不同的方式来描述概率.

3.连续型随机变量的概率函数与分布函数

① 概率函数

其实连续型随机变量的概率函数 换了一个 名字,叫做 "概率密度函数".

为啥要换名字呢,其实我们仔细一想就能大致明白,连续型随机变量的数值是连续的,求它的概率是有"问题"的,就像一个物体,你要计算它每个点所对应的"质量".

下面我们来看一下,陈希孺老师所著的《概率论与数理统计》对密度函数的描述:

"密度函数"这名字由来可解释如下.

取定一个点 � ,则按分布函数的定义,事件 �<X<�+ℎ ( ℎ 为常数)的概率就为:
�(�+ℎ)−�(�) ,所以比值: [�(�+ℎ)−�(�)]/ℎ ,可以解释为 � 点附近
ℎ 这么长的区间 (�,�+ℎ) 内,单位长度所占有的概率. 令 ℎ→0 ,则这个比的极限,即 �′(�)=�(�),也就是 � 点处(无穷小的区段内)单位长的概率,或者说,它反映了概率在 � 点处"密集程度". 你可以设想一根极细的无穷长的金属杆,总质量为1,概率密度相当于杆上各点的质量密度.

可能说到这里,大家还是有点懵,继续往下看:

 

图5 分布函数与概率密度函数

(1)�(�)−�(�)=∫���(�)��

分析:概率密度函数其实一个定积分的函数,定积分在数学一般用来求面积,在这里你把"概率"理解为"面积"即可.

下面回答一些常见问题:

Q: 概率密度函数在某点的函数值,有什么意义?

A: 其实 概率密度函数值 即为 概率在该点的变化率.

千万不要误认为:概率密度函数值是 该点的概率.

 

举例:速度(概率密度)和距离(概率)

某一点的速度 不能认为是 某一点的距离,这样是没有意义的.

因为距离是从XX到XX的概念,所以概率也要有区间.

这个区间可以是 � 的邻域,对 � 的邻域 �(�) 进行积分,可以求得这个邻域的面积,这个面积大小就代表了事件在该邻域所发生的概率大小.

参考:

posted @ 2023-01-13 19:04  岭南春  阅读(937)  评论(0)    收藏  举报