在杂七杂八的事中坚持处理表格的OCR,历经一周时间,终有阶段结果。
主要工作:
自动分区、文字识别。
象这样一个表格:
自动分区后,得到正确分区效果:
其中,各分区模块颜色配置:
文字识别结果:
识别正确率在70%-80%。可以手动校对:
剩下的工作是自动生成WORD与PDF。这两项工作完成后,可以定一版了。
6.10前预交付市场。
posted on 2013-06-03 23:40 drgraph 阅读(1902) 评论(1) 收藏 举报
博客园 © 2004-2025 浙公网安备 33010602011771号 浙ICP备2021040463号-3