第六章笔记
6.1文件以字节为单位保存
文件是以字节(B=Byte)为单位来存储的
文件就是字节数据的集合。用1字节(=8位)表示的字节数据有256种,用二进制数来表示的话,其范围就是00000000~11111111。
6.2 RLE算法的机制
把文件内容用“数据×重复次数”的形式来表示的压缩方法称为RLE(Run Length Encoding,行程长度编码)算法
6.3 RLE算法的缺点
针对相同数据经常连续出现的图像、文件等,RLE算法可以发挥不错的效果,但它并不适合文本文件的压缩。
6.4 通过莫尔斯编码来看哈夫曼算法的基础
莫尔斯编码把一般文本中出现频率高的字符用短编码来表示。
6.5 用二叉树实现哈夫曼编码
哈夫曼算法是指,为各压缩对象文件分别构造最佳的编码体系,并以该编码体系为基础来进行压缩。因此,用什么样式的编码(哈夫曼编码)对数据进行分割,就要由各个文件而定。用哈夫曼算法压缩过的文件中,存储着哈夫曼编码信息和压缩过的数据。
6.7 可逆压缩和非可逆压缩
Windows的标准图像数据形式为BMP ,是完全未压缩的。由于显示器及打印机输出的bit(点)是可以直接映射(mapping)的,因此便有了BMP=bitmap这一名称。
除BMP格式以外,还有其他各种格式的图像数据形式。比如JPEG 格式、TIFF 格式、GIF 格式等。与BMP格式不同的是,这些图像数据都会用一些技法来对数据进行压缩。
能还原到压缩前状态的压缩称为可逆压缩,无法还原到压缩前状态的压缩称为非可逆压缩。
浙公网安备 33010602011771号