使用PdgCntEditor为图书PDF生成书签目录的简单实用操作步骤总结

使用PdgCntEditor为图书PDF生成书签目录的简单实用步骤总结

本教程将展示如何使用PdgCntEditor工具软件轻松完成这项任务。

一般操作步骤

  1. 在PdgCntEditor软件中打开PDF文件(如果无法保存目录,请查看Debug1部分的解决方法)。

  2. 从书籍目录页中复制目录内容。

  3. 粘贴复制的目录内容到PdgCntEditor软件中(如果多复制了目录页的罗马数字页码,请查看Debug2部分的解决方法)。

  4. 在PdgCntEditor中,全选文本。

  5. 依次点击上面的三个按钮:

    • 自动分割页码按钮(标有"g"图标)。
    • 自动缩进按钮(标有"1."图标)。
    • 设置起始页按钮(标有"pdf"图标)。
  6. 去除多余的"....."(可以在Sublime Text中执行此操作,操作前会自动高亮显示待处理内容,不易出错)。

    • 执行正则查找:\s.{3,}\s(\d+),替换为\t\1(具体说明见备注1)。
  7. 保存即可。

参考链接

小技巧

  • 如果书籍有缺失,可以选择从某一目录下的页码自动加减某个数字(选中内容后软件里也有自动加减页码数的按钮),进行更新。
  • 可以使用Sublime Text进行正则替换,操作前会自动高亮显示待处理内容,不易出错;PdgCntEditor帮助文档中提供了常用的正则规则。

备注

  1. 去除多余的"....."正则式解析:
    • 正则查找:\s.{3,}\s(\d+),替换为\t\1。
    • 这个查找正则表达式匹配0个或多个空格,后跟三个或更多的点,然后是0个或多个空格,最后是另一个或多个数字(即页码,使用括号捕获为第一组)。替换正则式表示tab加第一组内容,即将"......xx"替换为页码"xx"。

Debug

  1. 保存失败原因与解决:

    • 文档加密:需要先用pdf24解密。
    • 文档只读模式:需要先另存为一下,取消只读模式。
    • 已打开文档,需要先关闭。
  2. 从书籍目录页复制目录内容后,粘贴到软件中发现多粘贴了目录页的罗马数字页码:

    • 需要使用以下正则表达式:[ivx]+\sContents 替换为空。
    • 正则表达式 [ivx] 匹配的是罗马数字字符中的任何一个,以便匹配类似于 "i Contents"、"ii Contents"、"iii Contents" 等带有罗马数字序号的文本。
posted @ 2023-10-09 17:22  静即青争  阅读(1687)  评论(0)    收藏  举报