概率分布

概率分布

最近我在写博客的时候经常碰到概率分布,虽然学过概率论,对这个概念也有过来了解,但是发现,当真正的将这个概念运用于实际中时却碰到了问题。

概率分布定义:指用于表述随机变量取值的概率规律。
事件的概率表示了一次试验中某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即随机试验的概率分布。如果试验结果用变量X的取值来表示,则随机试验的概率分布就是随机变量的概率分布,即随机变量的可能取值及取得对应值的概率。根据随机变量所属类型的不同,概率分布取不同的表现形式。

概率分布也称概率分布律,上面的话意思就是,概率分布律可以表示出某一随机变量所有可能结果中的概率。那么一般有两种,一种是连续型变量,一种是离散型变量,当然这两种变量研究的问题也不一样,我们求得概率分布的目的是为了得到该随机变量得到某一离散值的概率,而连续型概率分布则为了得到该变量在某一区域的概率。当然还有条件概率分布,其实这个也很好理解,也就是在一个条件约束的情况下求要求的概率分布。

这里我们在引进一下熵,谈谈熵跟概率分布的关系,其实熵对于一个变量来说,它衡量的是这个随机变量的不确定性,关于熵我专门写了一篇博客讲解,感兴趣的可以了解一下。什么叫不确定性?就是说对于这个随机变量,我们通过它的概率分布对于它的一次随机结果中我们确定它会是那种结果的程度,不确定性越大熵越大,也就是对于这个随机变量我们对于某次它的随机结果中,我们越难确定它的结果是那种。

那么再来谈谈机器学习中的概率分布,其实机器学习中的概率分布往往都是离散型的随机变量的概率,当然,把它想像称可能是很多种离散结果的随机变量即可。

posted @ 2020-03-12 01:56  高兴_00  阅读(555)  评论(0编辑  收藏  举报