Beta分布

 用例子理解Bbta分布(一)

    Beta分布可以看做是分布之上的分布。我们以抛硬币为例,不过,我们并不假设硬币是均匀的(也就是说:并不假设每次抛硬币,正面朝上的概率为0.5),所以抛硬币的正面朝上的概率p是未知的(只知道p∈[0,1])。如果进行一次二项分布试验,在这次二项分布试验中,抛硬币10000次,其中正面朝上7000次,反面朝上3000次,我们可以得到,正负面朝上的概率分别为{p,1-p}={0.7,0.3}。但是我们并不确信这个结果是正确的。我们想要做10000次二项分布试验,在每次二项分布试验中,均抛硬币10000次(说不定在其他二项分布实验中,得到的正负面朝上的概率是{0.2,0.8}或者{0.6,0.4},这些情况都有可能),那么,我们想要知道,在这样的多次重复二项分布实验中,抛硬币最后得到正负面朝上概率为{0.7,0.3}这样概率为多少?这就是在求抛硬币的概率分布之上的分布。这样的分布就叫做Beta分布。正如二项分布可以看做多次进行伯努利试验所得到的分布一样,Beta分布也可以看做是多次进行二项分布的试验所得到的分布,是分布之上的分布。

 

用例子理解Bbta分布(二)

    有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”,能够说明它两面都是“花”吗?

    1. 贝叶斯推断

    按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是:P = 3/3 = 100%。但是抛三次实在太少了,完全有可能是运气问题。我们应该怎么办?

    贝叶斯认为在实验之前,应根据不同的情况对硬币有所假设。不同的假设会得到不同的推断。

    比如和滑不溜手的韦小宝玩。韦小宝可能拿出各种做过手脚的硬币,让我们猜不透,只能假设对硬币一无所知。这种假设之下,我们就只能根据实验结果来猜测。因此,实验结果是“扔三次,三次花”,倾向于认为韦小宝有可能作弊:

    大侠陈近南用的可能是公平硬币:

    而憨坏的多隆,真的有可能用两面“花”来和你玩:

 

    各种假设称为先验分布,结合刚才“扔三次,三次花”的实验数据,推断出硬币的后验分布,这就是贝叶斯推断:

                                        

    2.Beta分布 

    那么问题来了,“先验分布”,“后验分布”用数学怎么表示?对于扔硬币,Beta分布非常适合用来完成这个任务。

    2.1 先验分布

    Beta分布简记为:Beta(a,b),根据a,b参数的不同,形态各异:

    在韦小宝面前,我们对硬币一无所知。贝叶斯说,一无所知也就是意味着任何概率都是一样的,都是有可能的,所以选用均匀分布。Beta(1,1)正好就是均匀分布:

 

    正直的陈近南,可能用的是公平硬币,也就是说概率在0、1之间(0表示“字”,1表示“花”),Beta(5,5,)可以表示这样的分布:

 

    而憨坏的多隆,可能用了两面花,也就是说概率可能集中到1附近,Beta(5,1)可以表示这样的分布:

    也就是说可以用Beat 分布来模拟各种先验分布:

        一无所知:Beta(1,1)

        公平硬币:Beta(5,5)

        两面花:Beta(5,1)

    2.2 后验分布

    用Beta分布来模拟扔硬币的先验分布之后,通过贝叶斯推断,得到的后验分布依然是Beta分布:

                                           

     具体到这个例子:

                                    

     再具体到韦小宝的情况就是:

                                      

     图像上的变化就是:

    可以看到,作弊的可能性还是比较大的。

    陈近南的情况:

 

      结合试验数据之后,图像的中心从0.5往0.6方向移动了,作弊可能性有所增加,不过总体来看应该还是公平硬币的可能性大。

     多隆的情况:

 

     更向1集中,作弊的可能性非常高。

    3 代数细节

    3.1 贝叶斯推断

    贝叶斯推断:

                               

    的应用到二项式分布的数学细节如下。假设实验数据X|p 服从二项分布:

                                                                                       

     上面的式子根据贝叶斯定理可以表示为:

                                                                   

 

    其中k 为“花”的次数。分母与实验数据无关,可以视作常数:

    因此,写成下面这样更容易看清楚重点(其中\propto 表示两者之间成比例):

                                                                      

    3.2 Beta分布

     

       

    3.3 共轭先验

    对于二项式分布,用Beta 分布作为先验分布,通过贝叶斯推断之后,后验分布依然是Beta分布:

       

这种特性称为共轭先验

 

 

 

参考资料:

伯努利分布、二项分布、Beta分布、多项分布和Dirichlet分布与他们之间的关系,以及在LDA中的应用【存疑】

如何通俗理解 beta 分布?

 

posted @ 2018-07-20 16:32  小糊涂也学要编程  阅读(2168)  评论(0编辑  收藏  举报