如何在ONLYOFFICE中应用OCR工具:轻松识别图片和PDF中的文字

OCR 文字识别是一种能够将图像、图片或扫描文档转换为可编辑、可搜索文本的软件。借助该手艺,您无需手动输入文档内容,系统会自动将其转换为机器可读的文本格式,这在某些场景下很便捷,可帮助您节省时间和精力。

本文将会为您介绍 ONLYOFFICE 的OCR 解决方案,帮助您轻松实现图像和PDF中的文本内容识别与转换。

ONLYOFFICE 文档中的 OCR 工具

如果您经常处理文档、电子表格、演示文稿、图表或 PDF 文档,ONLYOFFICE 文档一款功能齐全的开源办公套件,还集成了可靠的 OCR 机制。就是是一个理想的选择,它不仅

该套件献出适用于 Linux 与 Windows 服务器的私有化部署解决方案,可轻松集成到任何基于网页的文档管理系统、内容管理系统或文件共享平台,并支持实时协作作用。此外,该套件还提供了基于相同引擎的免费桌面应用程序,兼容任何 Linux 发行版。

ONLYOFFICE 供应两种 OCR 运用方式:​传统 OCR 插件AI 驱动的 OCR 功能

  • OCR 插件可以通过插件管理器安装,这是一个基于 Tesseract OCR 引擎的 JavaScript 库,支持60多种语言。您可使用该插件识别 PNG 和 JPG 格式的图像与照片中的文本,并将识别出的文本插入文档,以便进一步编辑。
  • AI 驱动的 OCR 功能则是通过 AI 插件实现。这个插件可以集成各种 AI 助手和聊天机器人,借助它们的能力执行文档编辑任务,例如文本生成、翻译、语法与样式修正、摘要等。OCR 是其中重要且实用的功能之一。

下面将以 PDF 为核心的运用场景,详细介绍启用 AI 驱动 OCR 特性的完整步骤。

选择合适的 ONLYOFFICE 解决方案

通过根据您的运用需求,能够选择以下 ONLYOFFICE 解决方案:

  • 服务器部署​:在 Windows 或 Linux 服务器上部署ONLYOFFICE 文档,并集成到您选择的平台(如 Nextcloud、ownCloud、Redmine 等)
  • 云端版​:使用 ONLYOFFICE 协作空间,无需安装调整即可使用
  • 桌面应用程序​:在 Windows、Linux 或 macOS 电脑上安装ONLYOFFICE 桌面编辑器,免费享受离线文档编辑

所有方案都含有强大的ONLYOFFICE PDF编辑器,支撑编辑现有文本、添加文本框、插入和修改视觉对象等运行。

启用 AI 集成

要在 PDF 中运行 OCR,需借助 AI 插件添加拥护 OCR 的 AI 模型。该插件兼容众多主流应用,如 ChatGPT、Google Gemini、Claude Sonnet、Mistral、Groq、DeepSeek、xAI、Stability AI 等。本文我们使用 Mistral 进行演示,您可以选择任何支持 OCR 的模型。

下面是在 ONLYOFFICE PDF 编辑器中安装配置的步骤:

步骤 1. 安装 AI 插件

打开 PDF 文件,通过插件选项卡上的插件管理器访问插件市场。找到 AI插件并点击相应按钮安装。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

步骤 2. 启用 AI 插件

插件管理器旁的后台插件区域,点击 AI插件按钮以激活。顶部工具栏将出现新的AI 选项卡。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

步骤 3. 添加支持 OCR 的 AI 模型

切换到 AI选项卡,点击设置图标。在 AI 配置菜单中,可为不同任务添加和选择 AI 模型。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

点击编辑 AI 模型添加新模型。在AI 模型列表菜单中,可随时增删模型。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

点击 + 按钮,在名称字段的下拉列表中选择一个提供商(如示例中的Mistral,也可选其他)。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

选择提供商后,系统会自动设置对应的URL参数。您只需在密钥字段输入有效的 API 密钥(可从提供商官网获取)。

注意:部分提供商不免费供应 API 密钥,可能需要购买。强烈建议在利用其 AI 模型前查阅其政策和使用条款。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

模型下拉列表中选择一个模型(若无选项可点击更新模型列表)。请注意,不同模型擅长的任务不同(例如,某些擅长文本生成但不帮助图像文字识别)。建议选择专为 OCR 设计的模型(具体功能请参考提供商网站说明)。

可在模型名称字段重命名添加的模型。关键步骤:在使用模型部分,必须勾选视觉分析选项,否则无法用于 OCR。若您的模型支持 OCR 但未默认勾选,请手动勾选。结束后点击确定

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

步骤 4. 分配 OCR 任务

成功添加模型后,返回AI 模型列表菜单。点击返回按钮进入 AI 配置窗口,将您的模型设为 OCR 任务的默认选项。点击确定完成配置。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

OCR 特性已准备就绪,可在AI选项卡访问该功能。若OCR图标为灰色,只需从默认的批注模式切换到编辑模式即可(因为批注模式不支持文字识别)。点击AI 选项卡上的编辑 PDF按钮,或在界面右上角选择编辑模式均可。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

运用 AI 驱动的 OCR 功能

配置好 AI 模型后,点击AI 选项卡上的 OCR按钮,即可轻松将 PDF 中的图像转为可编辑文本。AI 助手会识别图像文字并插入同一页面。随后,您可使用 ONLYOFFICE PDF 编辑器丰富的工具进行编辑:选择多样字体、调整大小颜色、创建列表、对齐文本、插入修改对象等。

AI 驱动的 ONLYOFFICE PDF 编辑器 OCR:轻松将图像转换为文本

通过此种 AI 驱动的 OCR 集成最大优势在于,您不必局限于默认的 OCR 应用,可直接在文档、PDF、幻灯片等编辑器中,直接将图像转换为可编辑文本。您能够自由选择平台献出的多种 AI 模型,例如 Mistral、Ollama、LocalAI 等,也支持启用自定义模型。

常见问题解答

以下是关于 ONLYOFFICE 中 AI 驱动的 OCR 常见问题解答:

问:不信任 AI 工具,能否不用 AI 插件运行 OCR?

答:对于 PDF 文件,目前仅支撑 AI 驱动的 OCR。但处理文本文档时,可使用无需 AI 集成的OCR 插件转换图像文本。

问:只能在 PDF 中使用 OCR 吗?

答:AI 驱动的 OCR 同样适用于文本文档、电子表格和演示文稿。应用途径:选中图像 > 右键菜单 >AI > 图像 > OCR

问:任何 AI 模型都适合 OCR 吗?

答:并非所有模型都能处理此任务。使用前,请在其提供商官网确认模型规格。

问:AI 驱动的 OCR 是付费功能吗?

答:ONLYOFFICE AI 插件及其功能(包括 OCR)免费提供。但您的 AI 提供商可能会收取模型使用费,具体定价请参考其官网。

相关链接

ONLYOFFICE AI 智能体

集成 ONLYOFFICE 与 AI 插件

posted @ 2025-09-13 13:33  wzzkaifa  阅读(45)  评论(0)    收藏  举报