2020 年 5月 8 日随笔档案 - 贫民窟里的程序高手

一、Tesseract4.0训练字库 OCR 提高识别率必备(超详情)

摘要：由于tesseract的中文语言包“chi_sim”对中文手写字体或者环境比较复杂的图片，识别正确率不高，因此需要针对特定情况用自己的样本进行训练，提高识别率，通过训练，也可以形成自己的语言库。对其他语言库有兴趣的：https://github.com/tesseract-ocr/tessdata 阅读全文

posted @ 2020-05-08 15:05 贫民窟里的程序高手阅读(9074) 评论(0) 推荐(0)

Java使用Tess4J 实现简单的图像识别(Maven版)

摘要：一、前言最近有个朋友需要用Java做一个图像识别的东西，因此帮忙参考了网上资料写了一个基于Tess4J简单版的图像识别demo，供参考。二、简单实例 1、首先创建一个新的maven项目（创建教程在此省略，自行百度），将所需jar包引入pom.xml <dependencies> <depende 阅读全文

posted @ 2020-05-08 14:51 贫民窟里的程序高手阅读(3323) 评论(0) 推荐(0)

C# OCR识别

摘要： C# 识别文字我试验过的有两种，1.使用开源库tesseract，地址：https://github.com/tesseract-ocr/tesseracttesseract训练的语言包：https://github.com/tesseract-ocr/tessdata有专门针对C#的封装：http 阅读全文

posted @ 2020-05-08 14:46 贫民窟里的程序高手阅读(25611) 评论(1) 推荐(6)

C#调用OCR组件识别图片文字

摘要：图片识别的技术到几天已经很成熟了，只是相关的资料很少，为了方便在此汇总一下（C#实现），方便需要的朋友查阅，也给自己做个记号。图片识别的用途：很多人用它去破解网站的验证码，用于达到自动刷票或者是批量注册的目的，但我觉得它最吸引我的地方是可以让一些书写的东西，自动识别成电脑上的文字，比如说手拟的合同阅读全文

posted @ 2020-05-08 14:38 贫民窟里的程序高手阅读(2561) 评论(0) 推荐(0)

贫民窟里的程序高手

公告