如何理解概率密度函数(pdf),区别于概率质量函数(pmf)
区别于离散随机变量的分布列,提出连续随机变量的概率密度函数。首先连续随机变量即一切可能的取值充满某个区间\((a,b)\),在这个区间内有无穷\(\textbf{不可列}\)个实数,因此这类随机变量的概率分布不能再用分布列形式表示,转而用概率密度函数表示。
给出定义:
如果\(X\)是连续的,那么随机变量\(X\)的概率密度函数\(f(x)\)满足:
其中\(f_X(x) = f(x) =F'(x)\)
问题在我习惯性将概率密度函数等同于我们最熟悉的离散型的\(P\)即概率质量函数,这样的确理解起来更快,但容易小学生思维,这是我一向学数学的坏习惯,我不愿意接受新东西,反而一再将新东西归类到某个“旧”知识里,以为自己掌握了。今天复习指数分布,其概率密度函数为
从这里就可以看出来,当\(x = 0\)时,只要\(\lambda\)大于1,\(f(x)\)就是大于1的,那你把它认为是概率,就怎么都想不通了。
必须明确一点,概率密度函数本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率。
为此,我们开始整理相关概念...
茆诗松概统教材中用一个例子详细分析了概率密度函数的由来,当然这里我们不展开叙述。思想就是把随机变量\(X\)的取值一个接一个放在数轴上,累积地放,形成图形(俄罗斯方块...emm...)。其中横轴是单位长度,纵轴是单位长度上的频数,不失一般性,纵轴直接改为单位长度上的频率。那么随着\(x\)个数的变多和单位长度的变小,这个图形外形显现出一条光滑曲线。这时,这条曲线的纵坐标已是单位长度上的概率。
$\ \ \ $ 概率密度函数\(p(x)\)的值虽不是概率,但乘微分元\(dx\)就可得小区间\((x,x+dx)\)上概率的近似值,即
在\((a,b)\)上很多相邻的微分元的累积就得到\(p(x)\)在\((a,b)\)上积分,这个积分值不是别的,就是\(X\)在\((a,b)\)上取值的概率,即

浙公网安备 33010602011771号