《数据压缩》第二次作业

姓名:黄小梅      学号:140705010020

参考书《数据压缩导论(第4版)》

Page 30: 1、2、3

  1、设X是一个随机变量,取值范围是一个包含M个字母的符号集。证明0≤H(X)≤log2M。

      证:

         假设M=1, 则H(X)=-∑P(Xi)*log2P(Xi)=-(1*log21)=0,此时H(X)为最小

         当M>1且取包含每个字母的概率P(Xi)相等即为1/M时

         则H(X)=-∑P(Xi)*log2P(Xi)=-M(1/M*log1/M)=log2M

         又因熵具有极值性,所以此时H(X)最大

         所以说0≤H(X)≤log2M。

 

  2、证明如果观察到一个序列的元素为iid分布,则该序列的熵等于一阶熵。

      证:

          由于熵H(X)=limn→∞(1/n)*Gn

          Gn=-∑i1=1i1=m∑i2=1i2=m.....∑in=1in=mP(X1=i1,X2=i2,....Xn=in)*logP(X1=i1,X2=i2,....Xn=in)

          又该序列被观察到每个元素是独立同(idd)分布的

          则Gn=-n∑i1=1i1=mP(X1=i1)*logP(X1=i1),则

          H(X)=-∑P(X1=i1)*logP(X1=i1)为一阶熵。

 

  3、给定符号集A={a1,a2,a3,a4},求以下条件下的一阶熵:

      (a)P(a1)=P(a2)=P(a3)=P(a4)=1/4

             解:H(A)=-∑P(ai)*logP(ai)=-(4*1/4*log1/4)=2 bit/字符。

      (b)P(a1)=1/2,P(a2)=1/4,P(a3)=P(a4)=1/8

             解:H(A)=-∑P(ai)*logP(ai)=-(1/2*log1/2)-(1/4*log1/4)-(2*1/8*log1/8)=1/2+1/2+3/4=1.75 bit/字符。

      (c)P(a1)=0.505,P(a2)=1/4,P(a3)=1/8,P(a4)=0.12

             解:H(A)=-∑P(ai)*logP(ai)=-(0.505*log0.505)-(1/4*log1/4)-(1/8*log1/8)-(0.12*log0.12)

                                                 =-(0.505*log0.505)+1/2+3/8-(0.12*log0.12)

                                                 =7/8-(0.505*log0.505)-(0.12*log0.12)。

      

posted on 2016-09-12 20:30  彭云  阅读(199)  评论(0)    收藏  举报