2023 年 1月 31 日随笔档案 - 合合技术团队

公告

摘要：错字率是OCR任务中的重要指标，文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟，越来越多的纠错方法被提出。近年来深度学习在OCR领域取得了巨大的成功，但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解，同时也降低文本的信息价值。在某些领域，如医疗行业，识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式，下面分别对这两种纠错方式进行介绍。阅读全文

posted @ 2023-01-31 11:26 合合技术团队阅读(580) 评论(0) 推荐(0)

intsig

公告

2023年1月31日

文本纠错：提升OCR任务准确率的方法理解