读《程序是怎样跑起来的》第六章有感

第六章——亲自尝试压缩数据

压缩文件扩展名LZH和ZIP等。

1.文件以字节为单位保存
文件就是字节数据的集合,用1个字节表示的字节数据有256种,二进制来表示的话范围就是00000000~11111111。

2.RLE算法的机制
用“数据*重复次数”的形式表示就属于RLE算法压缩的文件。
RLE(行程长度编码)

3.RLE算法的缺点
适合字符重复出现的情况,例如相同数据经常连续出现的图像、文件,但不适合文本文件的压缩。
原因:文章中字符大量连续出现的情况不多见,文本文件使用RLE算法压缩后反而文件更大。

4.哈夫曼算法
哈夫曼算法的关键是“多次出现的数据用小于8位的字节数来表示,不常用的数据可以用超过8位的字节数来表示。”
注意:不管是否满8位的数据,最终都会以8位为单位保存在文件中。

哈夫曼算法:为各压缩对象文件分别构造最佳的编码体系,并以该编码体系为基础进行压缩。用哈夫曼算法压缩后的文件中,存储着哈夫曼编码信息和压缩后的数据。

哈夫曼算法能够大幅提升压缩比率。

5.可逆压缩和非可逆压缩
图像文件的压缩:
可以还原到压缩前的状态的压缩称为可逆压缩,无法还原到压缩前的状态的压缩称为非可逆压缩。

以上为本章所学内容,下章见!

posted @ 2024-02-27 21:02  睡觉艺术家  阅读(1)  评论(0编辑  收藏  举报