OCR论文精读报告1

A method for detecting text of arbitrary shapes in natural scenes that improves text spotting
https://github.com/wqtwjt1996/UHT
https://openaccess.thecvf.com/content_CVPRW_2020/papers/w34/Wang_A_Method_for_Detecting_Text_of_Arbitrary_Shapes_in_Natural_CVPRW_2020_paper.pdf
Qitong Wang, Yi Zheng, and Margrit Betke
Boston University
Boston, MA 02215
{wqt1996, yizheng, betke}@bu.edu

是CVPR-2020的一篇论文,介绍了一个基于流水线的文本识别框架,它可以检测和识别具有复杂背景的自然场景图像中各种字体、形状和方向的文本。主要解决任意形状的文本的识别。

  • 主要贡献是文本检测组件,称之为UHT,即UNet、Heatmap和Textfill的缩写。
  • UHT使用UNet计算候选文本区域的热图,并使用textfill算法在候选文本中的每个单词周围产生紧密的多边形边界。
  • 该方法利用从groundtruth注释提供的文本边界多边形中获取的groundtruth热图训练UNet。
  • 作者提出的文本识别框架,称为UHTA,结合了UHT与最先进的文本识别系统ASTER。






posted on 2021-01-12 10:24  宋岳庭  阅读(193)  评论(0编辑  收藏  举报