一、

1-1  压缩数据量

1-2  减少使用空间,减少信息存储空间,提高其传输、存储和处理效率

1-6  按压缩过程的可逆性进行分类,可分为无损压缩和有损压缩。

       按压缩的原理可以分为:预测编码、变换编码、量化和矢量量化编码、信息熵编码、子带编码、模型编码。

 

二、参考书《数据压缩导论(第4版)》Page 8     

1-4  1.doc、txt、sql数据库等文件,压缩比例就会非常大,但是像jpg,mp3等本身就是压缩格式的数字音频或者图片文件,压缩出来的比例就不大

       2.冗余度是表征信源信息率的多余程度,是描述信源统计特性的一个物理量,我们不能对冗余度进行定量论述

 

三、

3.

(a)由于P(a1)=P(a2)=P(a3)=P(a4)=1/4,所以

    H=-1/4*4*log21/4

      =- log21/4

      = log24=2(bits)

 

(b)H= -(1/2*log21/2+1/4*log21/4+1/8*log21/8+1/8*log21/8)

          =-1/2*log21/2-1/4*log21/4-1/8*log21/8-1/8*log21/8)

          =1/2+1/2+3/8+3/8=7/4

(c)H=-(0.505*log20.505+1/4*log21/4+1/8*log21/8+0.12*log20.12)

         =-0.505*log20.505-1/4*log21/4-1/8*log21/8-0.12*log20.12

         =-0.505*log20.505+1/2+3/8-0.12*log20.12

5.

(a)总的有84个字母,A出现的次数为21次,C出现的次数为24,G出现的次数为16次,T出现的次数为23次,那么

         P(A)=21/84=1/4,P(C)=24/84=2/7,P(G)=16/84=4/21,

         P(T)=23/84

         H=-(1/4*log21/4+2/7*log22/7+4/21*log24/21+23/84*log223/84)

           =-1/4*log21/4-2/7*log22/7-4/21*log24/21-23/84*log223/84

           =2(bits)

 

7.

#include<iostream>
#include<iomanip>
#include<ctime>

using namespace std;

 

int main()
{
int p,i,j;
char m[100][100];
srand(time(NULL));
cout<<setfill('0');
for(i=0;i<100;i++)
{
for(j=0;j<4;j++)
{
p=rand()%26;
m[i][j]=p+'a';
}
m[i][4]='\0';
cout
<<" "<<m[i]<<"\t";
}
return 0;
}