今天做出了一个新功能,PDF补丁丁在导出识别结果为XML文件后(见附图一:识别结果XML),可以将其重新写入PDF文档,变成可以检索的文本PDF(输出效果见附图二、附图三,为检查输出字符位置是否正确,特意将文字显示出来,在正式发布时文字将是隐形字符)。

目前尚有少量问题需要修复,将不日内将提供测试版下载。

附图一:识别结果XML 

 附图二: 输出效果(黑白竖排文本)

 附图三:输出效果二(JPEG灰度图片、横排文本)

 

posted on 2011-11-03 16:47  PDF补丁丁  阅读(730)  评论(0)    收藏  举报