随笔分类 -  PDF补丁丁程序发布

关于 PDF 补丁丁的发布信息
PDF 补丁丁 0.3.4.101 测试版已经发布
摘要:由于忙于其它项目的缘故,PDF 补丁丁的开发工作中断了一段时间。最新发布的测试版修正了 0.3.3 版的一些错误,并添加了少量功能。欢迎试用。个人时间和精力有限,一些原定在此版本发布的功能(如文档内容筛选器等)尚未完成,请继续等待。0.3.4.101 2012年11月6日新增功能: 导入简易书签文件时,自动检测文件编码(支持编码方式为:系统默认编码、UTF-8、UTF-16、BIG5)。 自动生成书签功能支持按文本位置筛选文本。 导出图片功能可以导出掩模图像。 文档结构探查器支持导出 ToUnicode 映射表数据。修改功能: 更新了 JBIG2 解码库。 更改书签编辑器合并书签功能,在合并以 阅读全文
posted @ 2012-11-06 09:09 PDF补丁丁 阅读(1294) 评论(4) 推荐(0)
PDF 补丁丁 0.3.3 正式版发布
摘要:经过多个月的开发,PDF 补丁丁 0.3.3 正式版已经发布。新版本新增文档结构探查器、写入OCR结果、JBIG2优化压缩黑白图片等多项实用功能,并修复程序的多项错误。欢迎在首页置顶下载。0.3.3.100 2012年3月13日新增功能: PDF 文件结构探查器。 将光学字符识别的结果写入 PDF 文档。 使用 JBIG2 压缩算法优化 PDF 黑白图片的压缩效果。 导出图片功能支持合并 JPEG 图片。 导出图片功能支持导出批注内的图片。 页码范围支持负数页码(从末尾起算的页码)。 导出、导入书签功能支持导出 Javascript 脚本。 支持... 阅读全文
posted @ 2012-03-13 09:05 PDF补丁丁 阅读(2775) 评论(1) 推荐(1)
PDF补丁丁0.3.3版即将发布
摘要:新版的PDF补丁丁修复了多处错误,增加写入OCR结果、JBIG2压缩、文档结构探查器、超大PDF文档支持等多项实用功能,欢迎下载使用。新增功能: PDF 文件结构探查器。 将光学字符识别的结果写入 PDF 文档。 使用 JBIG2 压缩算法优化 PDF 黑白图片的压缩效果。 导出图片功能支持合并 JPEG 图片。 导出图片功能支持导出批注内的图片。 页码范围支持负数页码(从末尾起算的页码)。 导出、导入书签功能支持导出 Javascript 脚本。 支持写入及读取超过 2G 的 PDF 文件。修改功能: 自动生成书签功能提取字体时忽略字体子集名称。 书签编辑器可以拖放文件打开 PDF 文档。 阅读全文
posted @ 2012-02-13 18:14 PDF补丁丁 阅读(1092) 评论(6) 推荐(0)
无损 JBIG2 编码库(Lossless JBIG2 Encoder)
摘要:有网友希望提供 PDFPatcher 的 JBIG2 编码库,因发此博文。此处提供的编码库源自agl在Github的开源代码。该代码编译后输出 EXE 文件,编码现存位图文件或 StdIn 提供的数据,未提供被其它应用程序调用的 DLL 库。为了在 PDF 补丁丁中增加 JBIG2 编码功能,我修改了该代码,去除了其有损压缩功能及 Leptonica 图像库的依赖关系,减少了编码器的文件大小。导出函数DLL 库导出的函数有三个(除下列方法之外,还有原代码提供的jbig2_encode_generic方法,该方法的调用方式请参见原代码的说明):uint8_t *jbig2_encode (int 阅读全文
posted @ 2012-02-01 11:29 PDF补丁丁 阅读(4148) 评论(6) 推荐(0)
PDF补丁丁 0.3.3.58版修复打开、输出超大型PDF文件问题
摘要:新的测试版修复了打开或输出超过 2GB 的超大型 PDF 文档问题。遇到此问题的网友请下载测试版测试。注意:程序可能存在问题,请不要覆盖原始文档!日前更新测试版0.3.3.68,修复打开、输出超过 2G 的大型 PDF 文件问题(0.3.3.58版的漏洞已被修复)。 阅读全文
posted @ 2011-11-07 11:29 PDF补丁丁 阅读(771) 评论(3) 推荐(0)
PDF补丁丁0.3.3版:字符识别结果写入PDF文件功能邀请测试
摘要:PDF补丁丁新测试版增加了将字符识别(OCR)的结果写入PDF文件的功能。操作方法:选择“识别图像文本”功能。指定PDF文档和信息文件路径,选中“保存原始的识别结果”复选框,然后点击“识别图像文本”按钮。程序将识别文档,并将识别结果保存成一个XML文件。再指定输出PDF文件路径,点击“写入识别结果”按钮。程序将把识别结果XML文件的数据和原始PDF文档合并,写入到输出PDF文件。如果发现识别结果有错字或文字先后位置不正确的,可以修改XML文件,然后重复步骤4。 如果发现问题请在此留言。敬告:硬盘位贱,数据无价,请保留原始PDF文件的备份! 阅读全文
posted @ 2011-11-04 11:10 PDF补丁丁 阅读(1060) 评论(3) 推荐(0)
PDF补丁丁将字符识别结果写入PDF文件功能即将完成
摘要:今天做出了一个新功能,PDF补丁丁在导出识别结果为XML文件后(见附图一:识别结果XML),可以将其重新写入PDF文档,变成可以检索的文本PDF(输出效果见附图二、附图三,为检查输出字符位置是否正确,特意将文字显示出来,在正式发布时文字将是隐形字符)。 目前尚有少量问题需要修复,将不日内将提供测试版下载。附图一:识别结果XML附图二: 输出效果(黑白竖排文本)附图三:输出效果二(JPEG灰度图片、横排文本) 阅读全文
posted @ 2011-11-03 16:47 PDF补丁丁 阅读(726) 评论(0) 推荐(0)
PDF 补丁丁0.3.3.20版新增JBIG2压缩功能,可为扫描PDF瘦身
摘要:经过好几天的开发,PDF 补丁丁增加了JBIG2编码压缩的功能。JBIG2是一种用于黑白图片的高效压缩算法,可以大幅减少扫描PDF文件所占用的磁盘空间。要使用此算法压缩 PDF 文档非常简单,在处理文档选项中选择“优化压缩黑白图片”,然后处理文档即可。优化压缩的条件:PDF内的扫描图片只有黑白两色。扫描图片不使用JPEG压缩或JBIG2压缩。(提示:可以使用结构探查器查看图片的压缩方式)图片足够大,使用JBIG2压缩后的尺寸能小于原尺寸。优化压缩选项可用于补丁文档操作和合并文档操作。JBIG2 压缩代码来自agl在Github的开源代码。另外,特别感谢 Rubypdf.com(博客园网志)在本 阅读全文
posted @ 2011-10-20 11:53 PDF补丁丁 阅读(2572) 评论(16) 推荐(1)
PDF 补丁丁0.3.3.16版修复PDF文件改名后书签失效的问题
摘要:日前有网友反馈PDF补丁丁导出指向外部PDF文档的书签项时页数少了一页,新测试版已将问题修复。这样,选中PDF文件选项“强制将外部链接转换为内部链接”选项,执行补丁,就可以修复一些古老PDF文件在改名后书签失效的问题。本测试版还增强了文件结构探查器的功能。 欢迎下载。 阅读全文
posted @ 2011-10-14 13:32 PDF补丁丁 阅读(1568) 评论(1) 推荐(0)
PDF 补丁丁 0.3.3.10 测试版(新增结构探查器可编辑 PDF 文档)
摘要:测试版中,PDF 结构探查器可编辑部分文档节点的值,还可删掉一些节点(目前有些节点无法编辑,没有撤销功能,保存时不要覆盖原始文档,请慎用)。PDF 爱好者和 PDF 高手可使用此工具修改 PDF 文档。 阅读全文
posted @ 2011-09-24 21:45 PDF补丁丁 阅读(506) 评论(0) 推荐(0)
PDF补丁丁0.3.3.9测试版(新增 PDF 文档结构探查器)
摘要:本次更新修复了程序的若干错误。主要新增的功能是:PDF 文档结构探查器,供 PDF 爱好者研究 PDF 之用。导出图片功能支持导出批注内的图片,以及合并拆散的 JPEG 图片。页码范围支持负数页码,负数页码表示从后面算起,如“-1”表示文档最后一页;“1--2”的第一个减号表示页码范围,第二个减号表示到文档倒数第二页为止,即从第1页到倒数第2页(不包含最后一页)。由于近来比较忙,更新程序的时间少了。接下来将计划按照网友的建议更改程序的界面。感谢各位一直以来的支持! 阅读全文
posted @ 2011-09-07 18:08 PDF补丁丁 阅读(577) 评论(0) 推荐(1)
PDF 补丁丁0.3.2版正式发布(新增PDF OCR,加强自动生成书签、书签编辑器等功能)
摘要:PDF 补丁丁是一个致力于解除 PDF 文件烦恼的工具箱。新版本新增了调用微软 Office 2003、Office 2007 的光学字符识别引擎来识别图片 PDF 文字的功能,并优化了大量的功能。请到博客首页置顶文章的链接下载程序及使用文档。以下是详细的更新列表:0.3.2.39 2011年7月1日新增功能: 使用光学字符识别图片文字。 导出图片功能支持自动选择导出目录。 支持 AES-256 加密。 自动生成书签功能增加按页码、字体名称、字体尺寸、文本内容筛选标题的条件。 自动生成书签功能增加是否合并标题、是否忽略重叠文本的选项。 导出或导入应用程序配置。 重置应用程序设置。 书签编辑器增 阅读全文
posted @ 2011-07-01 18:29 PDF补丁丁 阅读(3963) 评论(5) 推荐(0)
PDF 补丁丁0.3.2 即将发布正式版
摘要:经过一段时间的测试,PDF补丁丁0.3.2版即将迎来其正式发布的时刻。新版本有如下几点突出的改进: 引入调用微软 Office 的光学字符识别功能,用其识别图片 PDF 的文字(可用此功能制作书签)。 着重提高书签编辑器的编辑效率及使用方便程度。 加强自动生成书签功能。 支持 AES-256 算法加密的 PDF 文档。支持合并 JPEG 2000 图片到 PDF 文档。可以保存、加载、重置应用程序设置。 其它改进和缺陷修复。 目前正在撰写使用文档。 在使用测试版的过程中,如遇到任何问题请立即留言或给我发电邮。2011年4月18日:修正若干问题。2011年4月21日:修正导出图片、书签编辑器的若 阅读全文
posted @ 2011-04-28 12:52 PDF补丁丁 阅读(626) 评论(8) 推荐(0)
PDF补丁丁(0.3.2.14测试版)优化提取PDF页面功能,删除PDF页面更方便
摘要:新版本中,删除PDF页面更方便。操作方式选择原始文件和提取(删除)页面后的输出文件。在“页码范围”文本框输入需要提取页面的范围(如不输入,则提取所有页)。如需要删除页面,可填入到“排除页码范围”文本框。最后输出文档的页面是“页码范围”文本框中指定的页码减去“排除页码范围”文本框的页码后所剩的页码。例如,原书有300页,需要删除第1页和第300页,可保持“页码范围”文本框为空(默认为所有页码),在“排除页码范围”文本框中填入“1;300”。又如,需要删除第290到第300页,共11页,在“排除页码范围”文本框中填入“290-300”。又如,只需要提取原书第18到20页,共3页的内容,在“页码范围 阅读全文
posted @ 2011-04-26 09:13 PDF补丁丁 阅读(2635) 评论(0) 推荐(0)
PDF补丁丁(0.3.2.13测试版)新增光学字符识别(OCR)功能,将图片 PDF 文档的目录转换为书签
摘要:测试版优化了识别图片 PDF 文字的功能,并针对目录页作了优化。识别目录时,将结果文件保存为文本文件,就可以用书签编辑器打开编辑,并导入 PDF 文档。此功能减少了为图片 PDF 文档制作书签的人工输入和编辑工作量。操作方式选定原始文件,并指定输出结果保存的文件。在选项的“识别页码范围”文本框中填入需要做字符识别的页码(如不填,则识别所有页面,请填入 PDF 文档目录页的页码范围,如12-14,表示目录页为12到14页共3页)。根据原文档的排版特征选择适当的选项。点击“识别图像文本”按钮开始识别。识别后的文本结果将输出到日志界面(结果文件默认保存格式为文本格式)。编辑输出的文本文件,修正错误识 阅读全文
posted @ 2011-04-25 11:17 PDF补丁丁 阅读(1964) 评论(0) 推荐(1)
PDF补丁丁(0.3.2.1测试版)新增光学字符识别(OCR)功能,识别 PDF 文档图片的文字
摘要:说明此版本仅供测试。导出的信息文件为 XML 格式。识别结果将输出到日志窗口。需要安装 Microsoft Office Document Imaging 模块(在 Office 2003 或 2007 的安装组件里可以找到)。“文字排版方向”选项及相应的后处理算法暂时未发布,故该选项对结果无影响。操作方式选定原始文件并指定输出结果保存的文件。在选项的“识别页码范围”文本框中填入需要做字符识别的页码(如不填,则识别所有页面)。点击“识别图像文本”按钮开始识别。识别后的文本结果将输出到日志界面(结果文件目前只能为 XML 格式)。下载页面请到本博客首页下载。 阅读全文
posted @ 2011-04-14 10:36 PDF补丁丁 阅读(1257) 评论(0) 推荐(0)
PDF 补丁丁0.3.1.24新增PDF书签编辑器、JBIG2导出功能
摘要:程序需要.NET Framework 2.0 才能运行。敬告:硬盘位贱、数据无价,请在修改文件前做好备份!新增功能新版本新增了一个书签编辑器,支持多选项目拖放并修改样式属性等。以后用 PDF 补丁丁修改 PDF 书签就容易多了。PDF 书签编辑器支持的功能有:设置书签的样式(粗体、斜体、字体颜色);使用鼠标选择书签拖放的方式移动书签位置;搜索、替换书签的文本(支持正则表达式及XPath搜索替换);更改书签的动作属性;更改书签默认打开的状态;插入新的书签(现在比较繁琐,以后可能有更好的办法实现,现在还是推荐用 FoxItReader 来加书签罢);贴心设计的多项处理任务(点击“处理”按钮,在弹出 阅读全文
posted @ 2011-02-25 15:03 PDF补丁丁 阅读(3749) 评论(7) 推荐(0)
PDF 补丁丁 0.3.1 版正在开发之中
摘要:新增的功能有:PDF 书签编辑器。所有功能都可批量操作,选中书签项,然后点击相应命令即可。此外,我计划将光学字符识别功能嵌入到 PDF 补丁丁的“识别标题为书签”中。通过光学字符识别来制作书签将不再是不可能的事情。 阅读全文
posted @ 2011-01-31 09:02 PDF补丁丁 阅读(291) 评论(0) 推荐(0)
PDF 补丁丁 (修改PDF书签;拆分、合并、制作PDF;提取图片) 0.3.0.8 正式版
摘要:PDF 补丁丁 0.3.0.8 正式版新版本已经发布,请到博客首页下载。软件简介PDF补丁丁是一个用于修改PDF文件信息的工具。它具有以下功能:■ 修改文档(带“*”号部分功能需通过高级补丁修改功能实现):● 修改文档属性(如作者、主题、关键词等)。支持通过文件名重写文档属性。 ● 添加、修改或删除PDF文档的书签,设置书签的文字颜色、打开或收拢状态、点击后的跳转位置及页面缩放比例等。* ● 添加或修改页面内的链接。* ● 添加或更改PDF文档的逻辑页码编号。 ● 更改阅读器的初始设置(如显示比例、界面等)。 ● 裁剪或扩大页面尺寸。 ● 调整页面旋转方向。* ● 删除文档或页面内嵌的XML元 阅读全文
posted @ 2011-01-17 09:23 PDF补丁丁 阅读(6156) 评论(2) 推荐(0)
PDF 补丁丁(修改书签、拆分合并、提取图片、制作图片PDF) 0.2.9.6
摘要:PDF 补丁丁 0.2.9.6软件已经更新,请在博客首页下载最新版。PDF补丁丁是一个用于修改PDF文件信息的工具。它具有以下功能: 导出信息文件:将PDF文档属性、阅读器初始状态、页码设置、页面设置、书签等信息导出成可编辑的XML文件。 导入信息文件生成新文件:将上述信息文件和已有PDF文件合并,生成新的PDF文档,该PDF文档具有XML信息文件的设置(如页面设置、书签等)。通过先从原PDF文件导出信息文件,然后修改信息文件的内容,再导入生成新文件,就可以得到一个修改“补丁”过的PDF文件。 修改文档: 修改文档属性(如作者、主题、关键词等)。支持通过文件名重写文档属性。 添加、修改或删除P 阅读全文
posted @ 2010-11-11 08:58 PDF补丁丁 阅读(2733) 评论(3) 推荐(0)