Marior去除边距和迭代内容矫正用于自然文档矫正
作者提出了一种简单而有效的方法,Marior,以从粗到细的方式为变形文档图像矫正。作者采用两个级联模块,首先去除文档图像的边缘,然后对内容进行进一步的修正。所提出的Marior自适应地决定了迭代的次数,从而实现了效率和性能之间的权衡。作者提出的方法不仅在DocUNet [25]和OCR_REAL [23]基准数据集上取得了最先进的性能,而且成功地解决了具有大边缘区域的情况和没有边缘区域的情况,这在以往的研究中研究较少。这是在自然文档矫正方面的一个重大成功。在今后的工作中,有必要探索对这两个模块进行端到端优化,以获得更好的性能。 阅读全文
posted @ 2023-04-28 10:34 合合技术团队 阅读(242) 评论(1) 推荐(0)
近期,合合信息旗下扫描全能王推出液晶手写板(简称“手写板”),为用户带来仿真、流畅的书写绘画体验,一同发布的还有扫描全能王APP的新功能“拍手写板”。该功能可帮助用户在拍摄手写板内容后去除图片上的反光干扰,形成更贴近白纸、板报的图片,并通过手写字迹识别,快捷、有序地获取可编辑、可分享的电子文档,助力
本文研究了水印去除任务,开发了一种具有新的MBE、SMR和CFF模块的两阶段多任务网络,该网络可以对水印进行定位,同时恢复无水印图像。在两个数据集上的大量实验验证了作者所提出的网络的优越性。
【论文解读】不和谐区域定位 一、简要介绍 不和谐区域定位的目的是在与周围背景不兼容的合成图像中定位该区域。不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中,作者倾向于将输入的图像转换到另一个颜色空间,以放大不和谐区域与背景之间的域差异,从而使模型更容易地识别不和谐区域。为此,作者提
建立了可以有效地处理各种图表数据,而不需要做出启发式的假设的鲁棒 Box detector 系统;提出了一种网络来测量图例匹配阶段图例和检测元素之间的特征相似性;提供了一个关于从信息图表中获取原始表格的 baseline,并发现了一些关键的因素来提高各个阶段并发现了一些关键的因素来提高各个阶段的性能。实验结果证明了该系统的有效性。
3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。此次活动以“图文智能处理与多场景应用技术展望”为主题,特邀来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一道,面向行内研究者分享图
一、简要介绍 视觉信息提取(VIE)近年来受到了越来越多的关注。现有的方法通常首先将光学字符识别(OCR)结果组织成纯文本,然后利用标记级实体注释作为监督来训练序列标记模型。但是,它花费大量的注释成本,可能导致标签混淆,OCR错误也会显著影响最终性能。在本文中,作者提出了一个统一的弱监督学习框架,称
以“图文智能处理与多场景应用技术展望”为主题,聚焦图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等热门话题,特邀来自上海交大、厦门大学、复旦、中科大的知名高校的学者与合合信息技术团队一道,以直播的形式分享文档处理实践经验及NLP发展趋势,探讨ChatGPT与文档处理未来。
-引言 近年来,随着计算机技术的飞速发展,越来越多的研究者开始关注表格检测识别技术。表格检测识别技术是一种利用计算机自动处理表格的技术,它可以实现从文本中检测出表格,并进行识别和提取。这种技术有助于提高文本处理的效率,为计算机辅助知识发现和知识挖掘提供了支持。 表格检测和识别技术的发展可以追溯到20
浙公网安备 33010602011771号