PDF文件结构(二)
摘要:
PDF文件结构(二) ————逻辑结构 作者:bobob 邮件:zxbbobob@hotmail.com 要解析一个PDF文件,首先要掌握PDF的物理结构,这是第一步。但是这个仅仅只是基础,更重要的是对PDF逻辑结构的解析。PDF的逻辑大体上是一个树状结构,根节点是catalog字典,通过这里去解析页、目录、链接信息等等,在这里按照PDF的树形结构,详细讨论一下整个文件的逻辑框架。一、catalog根节点catalog是整个PDF逻辑结构的根节点,这个可以通过trailer的Root字段定位,虽然简单,但是相当重要,因为这里是PDF文件物理结构和逻辑结构的连接点。Catalog字典包含... 阅读全文
posted @ 2012-05-16 19:31 星空夜夏梦 阅读(807) 评论(0) 推荐(0)
浙公网安备 33010602011771号