• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

上一页 1 ··· 19 20 21 22 23 24 下一页

2023年5月19日

常用的表格检测识别方法 - 表格区域检测方法(下)

摘要: 常用的表格检测识别方法 - 表格区域检测方法(下) 本文介绍了一种利用可变形transformer对文档图像进行表格检测的半监督方法。该方法通过将伪标签生成框架集成到一个简化的机制中,减轻了对大规模注释数据的需要,并简化了该过程。同时生成伪标签产生了一个被称为“飞轮效应”的动态过程,随着训练的进行,一个模型不断改进另一个模型产生的伪边框。在该框架中,使用两个不同的模块学生和教师,对伪类标签和伪边界框进行了改进。这些模块通过EMA功能相互更新,以提供精确的分类和边界框预测。结果表明,当应用于TableBank和PubLayNet训练数据的10%、30%和50%时,该方法的性能超过了监督模型的性能。此外,当对PubLayNet的10%标记数据进行训练时,该模型的性能与当前基于cnn的半监督基线相比较。在未来,作者的目标是研究标记数据的比例对最终性能的影响,并开发出以最小数量的标记数据有效运行的模型。此外,作者还打算采用基于transformer的半监督学习机制来进行表结构识别任务。 阅读全文

posted @ 2023-05-19 11:08 合合技术团队 阅读(408) 评论(1) 推荐(1)

2023年5月18日

常用的表格检测识别方法-表格区域检测方法(上)

摘要: 常用的表格检测识别方法-表格区域检测方法(上) 表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进的模型方法。 阅读全文

posted @ 2023-05-18 12:19 合合技术团队 阅读(674) 评论(0) 推荐(0)

2023年5月17日

合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?

摘要: 合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题? 近日,中国图象图形大会(CCIG 2023)(简称“大会”)在苏州圆满落幕。本届大会以“图象图形·向未来”为主题,由中国科学技术协会指导,中国图象图形学学会主办,苏州科技大学承办,特邀谭铁牛院士、赵沁平院士、吴一戎院士等百余位国内外知名学者,来自代表企业的技术专家,共话图像图形学术研究与技术创新趋势,共谋行业新发展。 阅读全文

posted @ 2023-05-17 15:24 合合技术团队 阅读(168) 评论(0) 推荐(0)

2023年4月28日

Marior去除边距和迭代内容矫正用于自然文档矫正

摘要: Marior去除边距和迭代内容矫正用于自然文档矫正 作者提出了一种简单而有效的方法,Marior,以从粗到细的方式为变形文档图像矫正。作者采用两个级联模块,首先去除文档图像的边缘,然后对内容进行进一步的修正。所提出的Marior自适应地决定了迭代的次数,从而实现了效率和性能之间的权衡。作者提出的方法不仅在DocUNet [25]和OCR_REAL [23]基准数据集上取得了最先进的性能,而且成功地解决了具有大边缘区域的情况和没有边缘区域的情况,这在以往的研究中研究较少。这是在自然文档矫正方面的一个重大成功。在今后的工作中,有必要探索对这两个模块进行端到端优化,以获得更好的性能。 阅读全文

posted @ 2023-04-28 10:34 合合技术团队 阅读(235) 评论(1) 推荐(0)

2023年4月26日

合合信息新推出反光消除技术,助力手写文字识别更精准

摘要: 合合信息新推出反光消除技术,助力手写文字识别更精准 近期,合合信息旗下扫描全能王推出液晶手写板(简称“手写板”),为用户带来仿真、流畅的书写绘画体验,一同发布的还有扫描全能王APP的新功能“拍手写板”。该功能可帮助用户在拍摄手写板内容后去除图片上的反光干扰,形成更贴近白纸、板报的图片,并通过手写字迹识别,快捷、有序地获取可编辑、可分享的电子文档,助力 阅读全文

posted @ 2023-04-26 11:26 合合技术团队 阅读(181) 评论(0) 推荐(0)

2023年4月14日

SLBR通过自校准的定位和背景细化来去除可见的水印

摘要: SLBR通过自校准的定位和背景细化来去除可见的水印 本文研究了水印去除任务,开发了一种具有新的MBE、SMR和CFF模块的两阶段多任务网络,该网络可以对水印进行定位,同时恢复无水印图像。在两个数据集上的大量实验验证了作者所提出的网络的优越性。 阅读全文

posted @ 2023-04-14 11:45 合合技术团队 阅读(115) 评论(0) 推荐(0)

如何提升智能文档处理识别精度?合合信息“版面分析”实现新突破

摘要: 春季是繁忙的播种季,学生党迎来了开学季和紧张的研究生复试,职场人士也需要处理新签业务带来的大量不同类型的文件,比如合同、发票、档案等。这些文件在被拍照、扫描成电子文档的过程中,时常存在漏字、错位现象。究其原因,有个看似“冷门”却关键的技术点极大地影响了文字识别效果,这个技术便是“版面分析”。 近期, 阅读全文

posted @ 2023-04-14 10:54 合合技术团队 阅读(91) 评论(0) 推荐(0)

2023年4月7日

【论文解读】不和谐区域定位

摘要: 【论文解读】不和谐区域定位 【论文解读】不和谐区域定位 一、简要介绍 不和谐区域定位的目的是在与周围背景不兼容的合成图像中定位该区域。不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中,作者倾向于将输入的图像转换到另一个颜色空间,以放大不和谐区域与背景之间的域差异,从而使模型更容易地识别不和谐区域。为此,作者提 阅读全文

posted @ 2023-04-07 17:52 合合技术团队 阅读(51) 评论(0) 推荐(0)

2023年3月30日

一个有效的图表图像数据提取框架

摘要: 一个有效的图表图像数据提取框架 建立了可以有效地处理各种图表数据,而不需要做出启发式的假设的鲁棒 Box detector 系统;提出了一种网络来测量图例匹配阶段图例和检测元素之间的特征相似性;提供了一个关于从信息图表中获取原始表格的 baseline,并发现了一些关键的因素来提高各个阶段并发现了一些关键的因素来提高各个阶段的性能。实验结果证明了该系统的有效性。 阅读全文

posted @ 2023-03-30 15:22 合合技术团队 阅读(307) 评论(0) 推荐(2)

2023年3月22日

CSIG企业行-走进合合信息成功举行,聚焦生成式人工智能、智能文档处理前沿热点

摘要: CSIG企业行-走进合合信息成功举行,聚焦生成式人工智能、智能文档处理前沿热点 3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。此次活动以“图文智能处理与多场景应用技术展望”为主题,特邀来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一道,面向行内研究者分享图 阅读全文

posted @ 2023-03-22 15:44 合合技术团队 阅读(100) 评论(0) 推荐(0)

上一页 1 ··· 19 20 21 22 23 24 下一页
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3