《程序是怎样跑起来的》第六章

       这章讲了文件的压缩和一些压缩方式,压缩后的文件扩展名为LZH,ZIP。文件是字节数据的集合。

       把文件内容用 “数据*重复次数” 的压缩方法称为RLE(行程长度编码)例如AAAAAABBCDDEEEEEF可以压缩成A6B2C1D2E5F1这样是12个字符就是12个字节。RLE算法适用于压缩传真的图像,因为文字或者字符重复次数不多所以不适用于文本文件的压缩。其次是第二个压缩技巧:哈夫曼算法(LAA)可以写成 “重复次数*位数” 。在这里面还讲到了莫尔斯编码:如果短点长度为1,长点长度是3,间隔为1。还有哈弗曼编码是根据日常文本中各字符的出现频率来决定表示各字符的编码数据长度,哈夫曼算法是为各压缩对象文件分别构造最佳的编码体系,并以编码体系为基础来压缩,这两个都能提升压缩比率。

        最后讲了windows的标准图像数据形式为BMP格式,是完全未压缩的,由于显示器及打印机输出的bit是可以直接映射的,便有了BMP格式。还有可逆压缩(能还原到压缩前的状态)和非可逆压缩(无法还原到压缩前状态),文本文件不能进行非可逆压缩。

posted @ 2023-02-21 21:55  Lxiaopan  阅读(21)  评论(0)    收藏  举报