• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

上一页 1 ··· 21 22 23 24 25

2023年2月21日

基于深度学习的表格检测与识别技术的优势

摘要: 引言: 信息时代的高速发展导致数据的大量产生与频繁传输,单单依靠人力很难处理这些数据。依托于人工智能的兴起与发展,数据的利用变得更加高效。表格作为数据的一种重要载体,是人们为了让数据的组织形式更加标准和结构化而使用的一种数据类型。 表格的特点: 信息高度精炼集中,方便信息的检索和比较。表格被广泛用于 阅读全文

posted @ 2023-02-21 16:51 合合技术团队 阅读(344) 评论(0) 推荐(0)

2023年2月7日

复杂环境下ocr与印章识别技术理解及研发趋势

摘要: 印章识别可自动提取出印章文本,从而实现计算机替代人工审核比对,解决合同管理工作中人工审核时间成本高、人力成本高的难题,降低财税及商务合同签订过程的业务风险,使商务连接更加高效和便捷。 阅读全文

posted @ 2023-02-07 14:23 合合技术团队 阅读(1399) 评论(0) 推荐(0)

2023年2月2日

【弯曲矫正】智能文字识别技术-弯曲矫正概述

摘要: 文档总是由于纸张几何形状和捕获条件不受控制而形变。这阻碍了形变图像的信息提取,降低可读性,对数据增强和下游任务如OCR识别、版面分析与还原等任务增加难度,本文阐述了对于图像弯曲矫正的集中解决方案 阅读全文

posted @ 2023-02-02 11:29 合合技术团队 阅读(617) 评论(0) 推荐(0)

2023年2月1日

表格识别与内容提炼技术理解及研发趋势

摘要: 表格是各类文档中常见的对象,其结构化的组织形式方便人们进行信息理解和提取。表格的种类根据有无边框可以划分有线表、少线表、无线表。表格样式复杂多样,如存在背景填充、光照阴影、单元格行列合并等情况。大数据时代存在大量电子文档,应用表格识别技术能够减少表格处理时间,因此表格识别是文档理解领域的重要研究课题 阅读全文

posted @ 2023-02-01 15:43 合合技术团队 阅读(807) 评论(0) 推荐(0)

2023年1月31日

文本纠错:提升OCR任务准确率的方法理解

摘要: 错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。 近年来深度学习在OCR领域取得了巨大的成功,但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解,同时也降低文本的信息价值。在某些领域,如医疗行业,识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式,下面分别对这两种纠错方式进行介绍。 阅读全文

posted @ 2023-01-31 11:26 合合技术团队 阅读(566) 评论(0) 推荐(0)

上一页 1 ··· 21 22 23 24 25
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3