PNG 文件结构
PNG图像文件介绍
PNG图像文件格式
PNG是可携式网络图像(portable network graphics)的英文缩写。PNG是从网络上开始发展的,目的是替代GIF和JPG格式,PNG图像文件格式也是当今游戏中常用的图像资源文件格式 了。PNG图像文件支持的图像颜色非常丰富,存储灰度图时可使用16位色深表示,存储真彩色图像时色深更可达到48位之多。
PNG图像文件介绍
与BMP格式相比,PNG格式稍微复杂些。PNG图像支持从0~255级次的多层透明色,使用无损压缩的zlib压缩算法压缩图像数据。通常使用 zlib压缩过的图像文件大小比BMP使用的RLE压缩的效果好,BMP的RLE压缩算法只支持压缩8位以下的图像,对于16位以上的真彩色图像不支持图 像压缩,PNG使用的zlib压缩算法支持任何色深的图像数据压缩,压缩后的图像数据可以完整还原,相比之下JPG需要牺牲图像质量使用有损压缩来获得大 的压缩率。
最后有一点需要注意,PNG图像格式使用Big-Endian顺序存储数据。
PNG图像文件存储结构(1)
PNG文件存储结构的格式可以在http://www.w3.org/TR/REC-png.htm上找到定义。
BMP文件总体上由两部分组成,分别是PNG文件标志和数据块(chunks),如表5-8所示。其中数据块分为两类:关键数据块(critical chunk)和辅助数据块(ancillary chunks)。
表5-8 PNG文件的组成结构
| PNG文件标志 | 
| 数据块(chunks) | 
1.PNG文件标志
PNG文件标志由8字节数据组成:89 50 4E 47 0D 0A 1A 0Ah,其中50 4E 47对应的ASCII值是"PNG"。
2.数据块(chunks)
紧跟在PNG文件标志后面的数据是数据块(chunks),数据块(chunks)分为两类:关键数据块(critical chunks)和辅助数据块(ancillary chunks)。
关键数据块(critical chunk)在PNG文件中是必须有的,而辅助数据块(ancillary chunks)是可选的。
关键数据块(critical chunks)由4部分组成:文件头数据块(IHDR)、调色板数据块(PLTE)、图像数据块(IDAT)和图像结束数据(IEND),其中调色板数据块(PLTE)根据图像的色深可选。
辅助数据块(ancillary chunks)一共有14个,这些辅助数据块包含了很多信息,辅助数据块不是必须包含的。
PNG文件的关键数据块和辅助数据块的组织顺序如表5-9和表5-10所示。
表5-9 PNG文件的关键数据块(critical chunks)组织顺序
| 数据块名称 | 允许多 个数据块 | 位 置 | 
| 文件头数据块(IHDR) | 不允许 | 第一个数据块 | 
| 调色板数据块(PLTE) | 不允许 | 第二个数据块,可选 | 
| 图像数据块(IDAT) | 允许 | 如果有调色板数据块(PLTE),则是第三个数据块,如果没有调色板数据块(PLTE),则时第二个数据块。如果有多个图像数据块,则必须按图像数据连续存储 | 
| 图像结束数据(IEND) | 不允许 | 最后一个数据块 | 
表5-10 PNG文件的辅助数据块(ancillary chunks)组织顺序
| 数据块名称 | 允许多个 数据块 | 位 置 | 
| 基色和白色点数据块(cHRM) | 不允许 | 在PLTE和IDAT之前 | 
| 图像γ数据块(gAMA) | 不允许 | 在PLTE和IDAT之前 | 
| ICCP(iCCP) | 允许 | 在PLTE之后IDAT之前如果有iCCP,则无sRGB | 
| 数据块名称 | 允许多个 数据块 | 位 置 | 
| 样本有效位数据块(sBIT) | 不允许 | 在PLTE和IDAT之前 | 
| 标准RPG颜色(sRGB) | 不允许 | 在PLTE之后IDAT之前如 果有sRGB,则无iCCP | 
| 背景颜色数据块(bKGD) | 不允许 | 在PLTE之后IDAT之前 | 
| 图像直方图数据块(hIST) | 不允许 | 在PLTE之后IDAT之前 | 
| 图像透明数据块(tRNS) | 不允许 | 在PLTE之后IDAT之前 | 
| 物理像素尺寸数据块(pHYs) | 不允许 | 在IDAT之前 | 
| 建议调色板(sPLT) | 允许 | 在IDAT之前 | 
| 图像最后修改时间数据块(tIME) | 不允许 | 无限制 | 
| 国际文本数据(iTXt) | 允许 | 无限制 | 
| 文本信息数据块(tEXt) | 允许 | 无限制 | 
| 压缩文本数据块(zTXt) | 允许 | 无限制 | 
PNG图像文件存储结构(2)
用图像可以清晰显示表5-9和表5-10之间的关系,如图5-13和图5-14所示。
| 
 | 
| (点击查看大图)图5-13 包含调色板数据块(PLTE)的PNG图像文件格式 | 
| 
 | 
| (点击查看大图)图5-14 不包含调色板数据块(PLTE)的PNG图像文件格式 | 
图中上标的含义如表5-11所示。
表5-11 上标的含义
| 符 号 | 含 义 | 
| 1 | 只有1个 | 
| + | 1个或多个 | 
| ? | 0个或1个 | 
| * | 0个或多个 | 
| | | 2选1 | 
PNG图像文件中每一块数据块的格式都是相同的,分别由4个部分组成,格式如表5-12所示。
表5-12 PNG文件的数据块格式
| 字 段 名 | 大小(单 位:字节) | 描 述 | 
| Length(长度) | 4 | 指定数据块中的数据长度 | 
| Chunk Type Code(数据块类型码) | 4 | 数据块类型,例如 IHDR、PLTE、IDAT等 | 
| Chunk Data(数据块数据) | Length | 存储数据 | 
| CRC(循环冗余检测) | 4 | 循环冗余码 | 
CRC循环冗余码生成的计算方式是通过对Chunk Type Code和Chunk Data中的数据进行计算得到的,计算方式如下:
| x32+x26+x23+x22+x16+x12+x11+x10+x8+x7+x5+x4+x2+x+1 
 | 
PNG图像文件存储结构(3)
下面将讲解在PNG文件中的4个关键数据块(critical chunk)的含义。
① 文件头数据块(IHDR)
文件头数据块(IHDR)它包含有PNG文件中存储的图像数据的基本信息,如图像的宽高、色深、颜色类型、压缩方式等。一个PNG文件只能有一个文件头数据块,表5-13列出了文件头数据块(IHDR)中各字段的含义。
表5-13 文件头数据块(IHDR) 中各字段的含义
| 字段名 | 大小(单 位:字节) | 描 述 | 
| Width | 4 | 图像宽度,以像素为单位 | 
| Height | 4 | 图像高度,以像素为单位 | 
| Bit depth | 1 | 图像深度: 索引彩色图像:1,2,4或8 灰度图像:1,2,4,8或16 真彩色图像:8或16 | 
| ColorType | 1 | 颜色类型: 0:灰度图像,1,2,4,8或16 2:真彩色图像,8或16 3:索引彩色图像,1,2,4或8 4:带α通道数据的灰度图像,8或16 6:带α通道数据的真彩色图像,8或16 | 
| Compression method | 1 | 压缩方法(LZ77变种算法) | 
| Filter method | 1 | 滤波器方法 | 
| Interlace method | 1 | 隔行扫描方法: 0:非隔行扫描 1: Adam7(由Adam M. Costello开发的7遍隔行扫描方法) | 
文件头数据块(IHDR)结构可以使用如下代码定义:
| typedef struct { 
 | 
② 调色板数据块(PLTE)
PNG的调色板数据块(PLTE)和之前介绍BMP图像格式中的调色板类似,都是提供给8位色深以下的图像使用。PNG的调色板由3个字节组成,每个字节分别表示红、绿、蓝三色的颜色值。
对于PNG图像文件来说,大于8位色深的图像,如真彩色图像也可以使用调色板,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。
一个PNG文件只能有一个调色板数据块,调色板数据块从下标0开始,表5-14列出了调色板数据块(PLTE)中各字段的含义。
表5-14 调色板数据块(PLTE) 中各字段的含义
| 字段名 | 大小(单 位:字节) | 描 述 | 
| btRed | 1 | 红色颜色值 | 
| btGreen | 1 | 绿色颜色值 | 
| btBlue | 1 | 蓝色颜色值 | 
调色板数据块(PLTE)结构可以使用如下代码定义:
| typedef struct { 
 | 
PNG图像文件存储结构(4)
③ 图像数据块(IDAT)
PNG的图像数据块(IDAT)存储图像的实际数据,相当于BMP图像的图像数据,由于PNG可包含多幅图像,所以PNG的图像数据块可能是由一幅图像的数据组成,也可能是由多幅图像的数据组成。
图像数据块中的图像数据可能是经过变种的LZ77压缩编码DEFLATE压缩的,关于DEFLATE详细介绍可以参考《DEFLATE Compressed Data Format Specification version 1.3》,网址: http://www.ietf.org/rfc/rfc1951.txt 。
图像数据块(IDAT)结构可以使用如下代码定义:
| PNG_CHUNK_HEADER
  chunkHdr; | 
④ 图像结束数据(IEND)
PNG的图像结束数据(IEND)用来标记PNG文件结束,并且必须要放在文件的尾部。一般情况下,所有PNG图像结束数据(IEND)的十六进制数值都是一样的,具体的数值如下:
| 00 00 00 00 49 45 4E 44 AE 42 60 82 | 
PNG的辅助数据块(ancillary chunks)一共有14个,可以分为5类,如表5-10所示,由于篇幅关系不能将全部辅助数据块(ancillary chunks)的详细结构进行说明,如果读者有兴趣请参考 http://www.w3.org/TR/REC-png.html。
分析PNG图像文件结构(1)
结合上面对PNG文件的分析,下面分别对256色和16位色的PNG图像进行十六进制分析,通过分析PNG文件让读者更深入了解PNG文件格式。
如图5-15和图5-16所示,分别为256色PNG图像pic1.png和16位色PNG图像pic2.png。其中pic1.png图像的分辨 率为200×150,文件大小为19 534 字节。pic2.png图像的分辨率为200×150,文件大小为104 744字节,带透明通道。
| 图5-15 pic1.png图像 | 
| 
 | 
| 图5-16 pic2.png图像 | 
现在来分析pic1.png的图像文件,在Winhex中打开pic1.png,如图5-17所示。
| 
 | 
| (点击查看大图)图5-17 在Winhex中打开pic1.png文件 | 
首先分析PNG的文件标志。根据PNG文件的定义,从文件头开始前8字节数据是PNG文件的标志,如图5-18所示。
| 
 | 
| (点击查看大图)图5-18 PNG文件的文件标志 | 
接下来应该就是PNG文件的数据块结构了,按照前面对PNG文件结构的分析,第一个数据块应该是文件头数据块(IHDR)数据块,文件头数据块(IHDR)定义了PNG文件的宽高、色深、压缩方法等参数,如图5-19所示。
| 
 | 
| (点击查看大图)图5-19 文件头数据块(IHDR)结构 | 
分析PNG图像文件结构(2)
表5-15归纳了pic1.png图像文件中文件头数据块(IHDR)中各字段的含义。由于PNG文件使用Big-Endian顺序存储数据,所以不需要反转字节数据理解。
表5-15 pic1.png图像文件中文件头数据块(IHDR)的各字段含义
| 十六进制值 | 描 述 | 
| 00 00 00 0D | 文件头的数据长度,00 00 00 0D =13 | 
| 49 48 44 52 | 数据块类型标志,49 48 44 52的ASCII值等于IHDR | 
| 00 00 00 C8 | 图像的宽度,00 00 00 C8 = 200 | 
| 00 00 00 96 | 图像的高度,00 00 00 96 = 150 | 
| 08 | 色深,表示2的8次幂等于256色 | 
| 03 | 03表示索引图像 | 
| 00 | 00表示使用Deflate压缩编码压缩图像数据 | 
| 00 | 00表示为将来使用更好的压缩方法预留 | 
| 00 | 00表示非隔行扫描 | 
| AC 02 37 2B | AC 02 37 2B表示CRC | 
从表5-14看到pic1.png文件的文件头数据块(IHDR)结构中的CRC字段的值为AC 02 37 2B,这个CRC值是按照从数据块类型标志字段到CRC字段前一字节的数据计算而来的,即使用数据49 48 44 52 00 00 00 C8 00 00 00 96 08 03 00 00 00计算,CRC的计算代码如下:
|    /*8位消息的CRC表格*/ | 
继续分析下面的数据块,PNG图像文件的数据块类型由数据块类型标志决定,按照PNG图像文件中数据块的数据结构分析,接下来的数据块是物理像素尺寸数据块(pHYs),物理像素尺寸数据块(pHYs)指定像素大小或图像的宽和高的比例。
表5-16所示为物理像素尺寸数据块(pHYs)中各字段的含义。
表5-16 物理像素尺寸数据块(pHYs) 中各字段的含义
| 字 段 名 | 大小(单 位:字节) | 描 述 | 
| physPixelPerUnitX | 4 | 每单位多少像素,x轴 | 
| physPixelPerUnitY | 4 | 每单位多少像素,y轴 | 
| UnkownUnit,Meter | 1 | 枚举类型,UnkownUnit=0,表示只定义了像素显示的比例,未定义实际像素大小。 枚举类型,Meter=1,表示定义单位为米 | 
物理像素尺寸数据块(pHYs)的结构可以用以下代码定义:
| PNG_CHUNK_HEADER
  chunkHdr ; | 
图5-20所示为pic1.png中的物理像素尺寸数据块(pHYs)的结构。
| 
 | 
| (点击查看大图)图5-20 pic1.png中的物理像素尺寸数据块(pHYs)的结构 | 
分析PNG图像文件结构(3)
表5-17所示为pic1.png图像文件中物理像素尺寸数据块(pHYs)中各字段的含义。
表5-17 pic1.png图像文件中物理像素尺寸数据块(pHYs)中各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 00 09 | 物理像素尺寸数据块的长度,00 00 00 09 =9 | 
| 70 48 59 73 | 数据块类型标志,70 48 59 73的ASCII值等于pHYs | 
| 00 00 0B 13 | x轴上每米像素的数量,00 00 0B 13 = 2835,即每米2835个像素 | 
| 00 00 0B 13 | y轴上每米像素的数量,00 00 0B 13 = 2835,即每米2835个像素 | 
| 01 | Meter=1,将单位定义为米 | 
| 00 9A 9C 18 | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是iCCP,iCCP数据块是PNG解码时进行特殊的颜色处理信息。
iCCP数据块的结构可以用以下代码定义:
| PNG_CHUNK_HEADER chunkHdr 
 | 
图5-21所示为pic1.png中的iCCP的数据结构。
| 
 | 
| (点击查看大图)图5-21 pic1.png图像文件中iCCP数据块结构 | 
| 
 | 
| (点击查看大图)图5-21 pic1.png图像文件中iCCP数据块结构 | 
表5-18所示为pic1.png图像文件中的iCCP数据块各字段的含义。
表5-18 pic1.png图像文件中的iCCP数据块各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 0A 4D | ICCP数据块的长度,00 00 0A 4D = 2637 | 
| 69 43 43 50 | 数据块类型标志,69 43 43 50的ASCII值等于iCCP | 
| 50 68 6F 74 6F 73 68 6F 70 20 49 43 43 20 70 72 6F 66 69 6C 65 00 | 配置文件名,长度1~79字节,以0作为终止符的字符串。 50 68 6F 74 6F 73 68 6F 70 20 49 43 43 20 70 72 6F 66 69 6C 65 00的ASCII值等于Photoshop ICC profile | 
| 00 | 压缩方法,0表示使用deflate压缩 | 
| 78 DA 9D 53~F7 84 F3 FB | 压缩后的配置文件,解码时使用 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是gAMA,gAMA数据块是PNG解码时进行gamma校正的信息。
gAMA数据块的结构可以用以下代码定义:
| PNG_CHUNK_HEADER
  chunkHdr; | 
图5-22所示为pic1.png中的gAMA的数据结构:
| 
 | 
| (点击查看大图)图5-22 pic1.png图像文件中gAMA数据块结构 | 
分析PNG图像文件结构(4)
表5-19所示为pic1.png图像文件中的gAMA数据块各字段的含义。
表5-19 pic1.png图像文件中的gAMA数据块各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 00 04 | gAMA数据块的长度,00 00 00 04 = 4 | 
| 67 41 4D 41 | 数据块类型标志,67 41 4D 41的ASCII值等于gAMA | 
| 00 00 B1 8E | gamma校正信息 | 
| 7C F8 51 93 | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是cHRM,cHRM是在设备不能够显示正确的颜色时,使图像尽可能校正颜色的信息,也叫做设备无关的颜色信息。
cHRM数据块的结构可以用以下代码定义:
| typedef
  struct { | 
图5-23所示为pic1.png中的cHRM的数据结构。
| 
 | 
| (点击查看大图)图5-23 pic1.png图像文件中cHRM数据块结构 | 
表5-20所示为pic1.png图像文件中的cHRM数据块各字段的含义。
表5-20 pic1.png图像文件中的cHRM数据块各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 00 20 | cHRM数据块的长度,00 00 00 20 = 32 | 
| 63 48 52 4D | 数据块类型标志,63 48 52 4D的ASCII值等于cHRM | 
| 00 00 7A 25 | 白色点的x轴坐标,00 00 7A 25 = 31269 | 
续表
| 十六进制值 | 描 述 | 
| 00 00 80 83 | 白色点的y轴坐标,00 00 80 83 = 32899 | 
| 00 00 F9 FF | 红x坐标,00 00 F9 FF = 63999 | 
| 00 00 80 E9 | 红y坐标,00 00 80 E9 = 33001 | 
| 00 00 75 30 | 绿x坐标,00 00 75 30 = 30000 | 
| 00 00 EA 60 | 绿y坐标,00 00 EA 60 = 60000 | 
| 00 00 3A 98 | 蓝x坐标,00 00 3A 98 = 15000 | 
| 00 00 17 6F | 蓝x坐标,00 00 17 6F = 5999 | 
| 92 5F C5 46 | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是调色板数据块(PLTE),因为pic1.png是256色图像,所以应该有256个调色板项,每个调色板项占3字节。
调色板数据块(PLTE)的结构可以用以下代码定义:
| typedef struct { 
 | 
分析PNG图像文件结构(5)
图5-24所示为pic1.png中的调色板数据块(PLTE)的数据结构。
| 
 | 
| (点击查看大图)图5-24 pic1.png图像文件中调色板数据块(PLTE)结构 | 
| 
 | 
| (点击查看大图)图5-24 pic1.png图像文件中调色板数据块(PLTE)结构 | 
表5-21 所示为pic1.png图像文件中的调色板数据块(PLTE)各字段的含义。
表5-21 pic1.png图像文件中调色板数据块(PLTE)各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 03 00 | PLTE数据块的长度,00 00 03 00 = 768 | 
| 50 4C 54 45 | 数据块类型标志,50 4C 54 45的ASCII值等于PLTE | 
| 00 00 00 | 调色板第1个索引 | 
| FF FF FF | 调色板第2个索引 | 
| EA FF FF | 调色板第3个索引 | 
| ………… | 调色板第…个索引 | 
| E4 DC DC | 调色板第255个索引 | 
| FF FF FF | 调色板第256个索引 | 
| 7D 2C 3D AD | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是图像透明数据块(tRNS),对于256色图像来说,图像透明数据块(tRNS)一共有256项,每项对应调色板数据块中的一项,00代表透明,FF代表不透明。
图像透明数据块(tRNS)的结构可以用以下代码定义:
| PNG_CHUNK_HEADER
  chunkHdr; | 
图5-25所示为pic1.png中的图像透明数据块(tRNS)的数据结构。
| 
 | 
| (点击查看大图)图5-25 pic1.png图像文件中图像透明数据块(tRNS)的结构 | 
表5-22所示为pic1.png图像文件中的图像透明数据块(tRNS)各字段的含义。
表5-22 pic1.png图像文件中图像透明数据块(tRNS)各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 01 00 | tRNS数据块的长度,00 00 01 00 = 256 | 
| 74 52 4E 53 | 数据块类型标志,74 52 4E 53的ASCII值等于tRNS | 
| FF~00 | 图像透明数据块,一共256个,每个对应调色板中的一项,00代表透明,FF代表不透明 | 
| 53 F7 07 25 | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是图像数据块(IDAT)。对于256色图像来说,图像数据块(IDAT)存放的是 指向调色板的索引序号,对于16位色以上图像,图像数据块(IDAT)存放的是实际像素颜色,按0xRRGGBB排列。需要注意的是,图像数据块 (IDAT)中的数据是经过变种的LZ77压缩过的。
图像数据块(IDAT)的结构可以用以下代码定义:
| PNG_CHUNK_HEADER
  chunkHdr; | 
分析PNG图像文件结构(6)
图5-26所示为pic1.png中的图像数据块(IDAT)的数据结构。
| 
 | 
| (点击查看大图)图5-26 pic1.png中的图像数据块(IDAT)的数据结构 | 
| 
 | 
| (点击查看大图)图5-26 pic1.png中的图像数据块(IDAT)的数据结构 | 
表5-23所示为pic1.png图像文件中的图像数据块(IDAT)各字段的含义。
表5-23 pic1.png图像文件中图像数据块(IDAT)各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 3D 53 | IDAT数据块的长度,00 00 3D 53 = 15699 | 
| 49 44 41 54 | 数据块类型标志,49 44 41 54的ASCII值等于IDAT | 
| 78~67 | 图像数据块,一共15699字节,使用变种的LZ77压缩过 | 
| 0E EE 51 34 | CRC值 | 
继续分析下面的数据,按照前面的分析方法,分析出接下来的数据块是图像结束数据(IEND),一般情况下所有PNG图像的图像结束数据(IEND)是一样的,除非自行修改。
图像结束数据(IEND)的结构可以用以下代码定义:
| PNG_CHUNK_HEADER chunkHdr; 
 | 
图5-27所示为pic1.png中的图像结束数据(IEND)的数据结构。
| 
 | 
| (点击查看大图)图5-27 pic1.png中的图像结束数据(IEND)的数据结构 | 
表5-24所示为pic1.png图像文件中的图像结束数据(IEND)各字段的含义。
表5-24 pic1.png图像文件中图像结束数据(IEND)各字段的含义
| 十六进制值 | 描 述 | 
| 00 00 00 00 | IEND数据块的长度,00 00 00 00 = 0 | 
| 49 45 4E 44 | 数据块类型标志,49 45 4E 44的ASCII值等于IEND | 
| AE 42 60 82 | CRC值 | 
pic1.png文件格式已经分析完毕,pic2.png的文件格式可以参考上面pic1.png的分析,表5-25显示了pic1.png和pic2.png的文件结构区别。
表5-25 pic1.png和pic2.png的文件结构区别
| pic1.png文件结构 | pic2.png文件结构 | 
| IHDR | IHDR | 
| pHYs | pHYs | 
| iCCP | iCCP | 
| gAMA | gAMA | 
| cHRM | cHRM | 
| PLTE | × | 
| tRNS | × | 
| IDAT | IDAT | 
| IEND | IEND | 
从表5-24可以看出pic2.png没有PLTE和tRNS数据块,因为pic2.png是16位色图像不需要使用调色板。
PNG图像文件存储的数据块比较多,一般情况每个PNG图像文件的iCCP、gAMA和cHRM数据块中的数据是一样的,只有IHDR和pHYs两个数据块中某些字段数据不同,如图5-28所示。
| 
 | 
| (点击查看大图)图5-28 两张不同的PNG格式图像的区别 | 
| 
 | 
| (点击查看大图)图5-28 两张不同的PNG格式图像的区别 | 
所 以很多时候游戏编程人员为了节省游戏资源占用的硬盘空间,去掉了PNG图像文件的某些数据块。如果游戏的资源打包文件包含了PNG图像文件,但去掉了 PNG某些数据块,这样对分析游戏资源包文件格式带来了一定的困难,但幸好PNG图像文件的某些数据块还是要保留的,例如图像数据块(IDAT),通过识 别某些数据块的标识字符串还是比较容易识别出PNG格式的。
PNG文件结构分析之一 dayf,2009-08-16 15:07:43
前言
我 们都知道,在进行J2ME的手机应用程序开发的时候,在图片的使用上,我们可以使用PNG格式的图片(甚至于在有的手机上,我们只可以使用PNG格式的图 片),尽管使用图片可以为我们的应用程序增加不少亮点,然而,只支持PNG格式的图片却又限制了我们进一步发挥的可能性(其实,应该说是由于手机平台上的 处理能力有限)。 在MIDP2中,或者某些厂商(如NOKIA)提供的API中,提供了drawPixels/getPixels的方法,这些方法进一步提高了开发者处理 图片的灵活性,然而,在MIDP2还未完全普及的今天,我们需要在MIDP1 .0中实现这类方法还属于异想天开,因此,为了实现更高级的应用,我们必须充分挖掘PNG的潜力。
PNG的文件结构
对于一个PNG文件来说,其文件头总是由位固定的字节来描述的:
| 十进制数 | 137 80 78 71 13 10 26 10 | 
| 十六进制数 | 89 50 4E 47 0D 0A 1A 0A | 
其中第一个字节0x89超出了ASCII字符的范围,这是为了避免某些软件将PNG文件当做文本文件来处理。文件中剩余的部分由3个以上的PNG的数据块(Chunk)按照特定的顺序组成,因此,一个标准的PNG文件结构应该如下:
| PNG文件标志 | PNG数据块 | …… | PNG数据块 | 
PNG数据块(Chunk)
PNG 定义了两种类型的数据块,一种是称为关键数据块(critical
chunk),这是标准的数据块,另一种叫做辅助数据块(ancillary
chunks),这是可选的数据块。关键数据块定义了4个标准数据块,每个PNG文件都必须包含它们,PNG读写软件也都必须要支持这些数据块。虽然
PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码,但规范提倡支持可选数据块。
下表就是PNG中数据块的类别,其中,关键数据块部分我们使用深色背景加以区分。
| PNG文件格式中的数据块 | ||||
| 数据块符号 | 数据块名称 | 多数据块 | 可选否 | 位置限制 | 
| IHDR | 文件头数据块 | 否 | 否 | 第一块 | 
| cHRM | 基色和白色点数据块 | 否 | 是 | 在PLTE和IDAT之前 | 
| gAMA | 图像γ数据块 | 否 | 是 | 在PLTE和IDAT之前 | 
| sBIT | 样本有效位数据块 | 否 | 是 | 在PLTE和IDAT之前 | 
| PLTE | 调色板数据块 | 否 | 是 | 在IDAT之前 | 
| bKGD | 背景颜色数据块 | 否 | 是 | 在PLTE之后IDAT之前 | 
| hIST | 图像直方图数据块 | 否 | 是 | 在PLTE之后IDAT之前 | 
| tRNS | 图像透明数据块 | 否 | 是 | 在PLTE之后IDAT之前 | 
| oFFs | (专用公共数据块) | 否 | 是 | 在IDAT之前 | 
| pHYs | 物理像素尺寸数据块 | 否 | 是 | 在IDAT之前 | 
| sCAL | (专用公共数据块) | 否 | 是 | 在IDAT之前 | 
| IDAT | 图像数据块 | 是 | 否 | 与其他IDAT连续 | 
| tIME | 图像最后修改时间数据块 | 否 | 是 | 无限制 | 
| tEXt | 文本信息数据块 | 是 | 是 | 无限制 | 
| zTXt | 压缩文本数据块 | 是 | 是 | 无限制 | 
| fRAc | (专用公共数据块) | 是 | 是 | 无限制 | 
| gIFg | (专用公共数据块) | 是 | 是 | 无限制 | 
| gIFt | (专用公共数据块) | 是 | 是 | 无限制 | 
| gIFx | (专用公共数据块) | 是 | 是 | 无限制 | 
| IEND | 图像结束数据 | 否 | 否 | 最后一个数据块 | 
为了简单起见,我们假设在我们使用的PNG文件中,这4个数据块按以上先后顺序进行存储,并且都只出现一次。
数据块结构
PNG文件中,每个数据块由4个部分组成,如下:
| 名称 | 字节数 | 说明 | 
| Length (长度) | 4字节 | 指定数据块中数据域的长度,其长度不超过(231-1)字节 | 
| Chunk Type Code (数据块类型码) | 4字节 | 数据块类型码由ASCII字母(A-Z和a-z)组成 | 
| Chunk Data (数据块数据) | 可变长度 | 存储按照Chunk Type Code指定的数据 | 
| CRC (循环冗余检测) | 4字节 | 存储用来检测是否有错误的循环冗余码 | 
CRC(cyclic redundancy check)域中的值是对Chunk Type Code域和Chunk
Data域中的数据进行计算得到的。CRC具体算法定义在ISO
3309和ITU-T
V.42中,其值按下面的CRC码生成多项式进行计算:
x32+x26+x23+x22+x16+x12+x11+x10+x8+x7+x5+x4+x2+x+1
下面,我们依次来了解一下各个关键数据块的结构吧。
IHDR
文件头数据块IHDR(header
chunk):它包含有PNG文件中存储的图像数据的基本信息,并要作为第一个数据块出现在PNG数据流中,而且一个PNG数据流中只能有一个文件头数据块。
文件头数据块由13字节组成,它的格式如下表所示。
| 域的名称 | 字节数 | 说明 | 
| Width | 4 bytes | 图像宽度,以像素为单位 | 
| Height | 4 bytes | 图像高度,以像素为单位 | 
| Bit depth | 1 byte | 图像深度: | 
| ColorType | 1 byte | 颜色类型: | 
| Compression method | 1 byte | 压缩方法(LZ77派生算法) | 
| Filter method | 1 byte | 滤波器方法 | 
| Interlace method | 1 byte | 隔行扫描方法: | 
由于我们研究的是手机上的PNG,因此,首先我们看看MIDP1.0对所使用PNG图片的要求吧:
- 在MIDP1.0中,我们只可以使用1.0版本的PNG图片。并且,所以的PNG关键数据块都有特别要求:
 IHDR
- 文件大小:MIDP支持任意大小的PNG图片,然而,实际上,如果一个图片过大,会由于内存耗尽而无法读取。
- 颜色类型:所有颜色类型都有被支持,虽然这些颜色的显示依赖于实际设备的显示能力。同时,MIDP也能支持alpha通道,但是,所有的alpha通道信息都会被忽略并且当作不透明的颜色对待。
- 色深:所有的色深都能被支持。
- 压缩方法:仅支持压缩方式0(deflate压缩方式),这和jar文件的压缩方式完全相同,所以,PNG图片数据的解压和jar文件的解压可以使用相同的代码。(其实这也就是为什么J2ME能很好的支持PNG图像的原因:))
- 滤波器方法:尽管在PNG的白皮书中仅定义了方法0,然而所有的5种方法都被支持!
- 隔行扫描:虽然MIDP支持0、1两种方式,然而,当使用隔行扫描时,MIDP却不会真正的使用隔行扫描方式来显示。
- PLTE chunk:支持
- IDAT chunk:图像信息必须使用5种过滤方式中的方式0 (None, Sub, Up, Average, Paeth)
- IEND chunk:当IEND数据块被找到时,这个PNG图像才认为是合法的PNG图像。
- 可选数据块:MIDP可以支持下列辅助数据块,然而,这却不是必须的。
 bKGD cHRM gAMA hIST iCCP iTXt pHYs
 sBIT sPLT sRGB tEXt tIME tRNS zTXt
关于更多的信息,可以参考http://www.w3.org/TR/REC-png.html
PLTE
调色板数据块PLTE(palette
chunk)包含有与索引彩色图像(indexed-color
image)相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image
data chunk)之前。
PLTE数据块是定义图像的调色板信息,PLTE可以包含1~256个调色板信息,每一个调色板信息由3个字节组成:
| 颜色 | 字节 | 意义 | 
| 
 | 
 | 
 | 
| 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 因此,调色板的长度应该是3的倍数,否则,这将是一个非法的调色板。
 对于索引图像,调色板信息是必须的,调色板的颜色索引从0开始编号,然后是1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为4的时候,调色板中的颜色数不可以超过2^4=16),否则,这将导致PNG图像不合法。
 真彩色图像和带α通道数据的真彩色图像也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。
 IDAT
 图像数据块IDAT(image data chunk):它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。
 IDAT存放着图像真正的数据信息,因此,如果能够了解IDAT的结构,我们就可以很方便的生成PNG图像。
 IEND
 图像结束数据IEND(image trailer chunk):它用来标记PNG文件或者数据流已经结束,并且必须要放在文件的尾部。
 如果我们仔细观察PNG文件,我们会发现,文件的结尾12个字符看起来总应该是这样的:
 00 00 00 00 49 45 4E 44 AE 42 60 82
 不难明白,由于数据块结构的定义,IEND数据块的长度总是0(00 00 00 00,除非人为加入信息),数据标识总是IEND(49 45 4E 44),因此,CRC码也总是AE 42 60 82。
 实例研究PNG
 以下是由Fireworks生成的一幅图像,图像大小为8*8,为了方便大家观看,我们将图像放大:
 
 
 使用UltraEdit32打开该文件,如下:
 00000000~00000007:
 
 可以看到,选中的头8个字节即为PNG文件的标识。
 接下来的地方就是IHDR数据块了:
 00000008~00000020:
 00 00 00 0D 说明IHDR头块长为13
- 49 48 44 52 IHDR标识
- 00 00 00 08 图像的宽,8像素
- 00 00 00 08 图像的高,8像素
- 04 色深,2^4=16,即这是一个16色的图像(也有可能颜色数不超过16,当然,如果颜色数不超过8,用03表示更合适)
- 03 颜色类型,索引图像
- 00 PNG Spec规定此处总为0(非0值为将来使用更好的压缩方法预留),表示使压缩方法(LZ77派生算法)
- 00 同上
- 00 非隔行扫描
- 36 21 A3 B8 CRC校验
00000021~0000002F:
可选数据块sBIT,颜色采样率,RGB都是256(2^8=256)
00000030~00000062:
这里是调色板信息
- 00 00 00 27 说明调色板数据长为39字节,既13个颜色数
- 50 4C 54 45 PLTE标识
- FF FF 00 颜色0
- FF ED 00 颜色1
- …… ……
- 09 00 B2 最后一个颜色,12
- 5F F5 BB DD CRC校验
00000063~000000C5:
这部分包含了pHYs、tExt两种类型的数据块共3块,由于并不太重要,因此也不再详细描述了。
000000C0~000000F8:
以上选中部分是IDAT数据块
- 00 00 00 27 数据长为39字节
- 49 44 41 54 IDAT标识
- 78 9C…… 压缩的数据,LZ77派生压缩方法
- DA 12 06 A5 CRC校验
IDAT中压缩数据部分在后面会有详细的介绍。
000000F9~00000104:
IEND数据块,这部分正如上所说,通常都应该是
00 00 00 00 49 45 4E 44 AE 42 60 82
至 此,我们已经能够从一个PNG文件中识别出各个数据块了。由于PNG中规定除关键数据块外,其它的辅助数据块都为可选部分,因此,有了这个标准后,我们可 以通过删除所有的辅助数据块来减少PNG文件的大小。(当然,需要注意的是,PNG格式可以保存图像中的层、文字等信息,一旦删除了这些辅助数据块后,图 像将失去原来的可编辑性。)
删除了辅助数据块后的PNG文件,现在文件大小为147字节,原文件大小为261字节,文件大小减少后,并不影响图像的内容。
其实,我们可以通过改变调色板的色值来完成一些又趣的事情,比如说实现云彩/水波的流动效果,实现图像的淡入淡出效果等等,在此,给出一个链接给大家看也许更直接:http://blog.csdn.net/flyingghost/archive/2005/01/13/251110.aspx,我写此文也就是受此文的启发的。
如 上说过,IDAT数据块是使用了LZ77压缩算法生成的,由于受限于手机处理器的能力,因此,如果我们在生成IDAT数据块时仍然使用LZ77压缩算法, 将会使效率大打折扣,因此,为了效率,只能使用无压缩的LZ77算法,关于LZ77算法的具体实现,此文不打算深究,如果你对LZ77算法的JAVA实现 有兴趣,可以参考以下两个站点:
参考资料:
PNG文件格式白皮书:http://www.w3.org/TR/REC-png.html
为数不多的中文PNG格式说明:http://dev.gameres.com/Program/Visual/Other/PNGFormat.htm
RFC-1950(ZLIB Compressed Data Format Specification):ftp://ds.internic.net/rfc/rfc1950.txt
RFC-1950(DEFLATE Compressed Data Format Specification):ftp://ds.internic.net/rfc/rfc1951.txt
LZ77算法的JAVA实现:http://jazzlib.sourceforge.net/
LZ77算法的JAVA实现,包括J2ME版本:http://www.jcraft.com/jzlib/index.html
详见: http://wenku.baidu.com => PNG图像文件介绍
 
                    
                     
                    
                 
                    
                 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号