贫民窟里的程序高手

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2020年5月8日

摘要: 由于tesseract的中文语言包“chi_sim”对中文手写字体或者环境比较复杂的图片,识别正确率不高,因此需要针对特定情况用自己的样本进行训练,提高识别率,通过训练,也可以形成自己的语言库。 对其他语言库有兴趣的:https://github.com/tesseract-ocr/tessdata 阅读全文
posted @ 2020-05-08 15:05 贫民窟里的程序高手 阅读(9020) 评论(0) 推荐(0)

摘要: 一、前言 最近有个朋友需要用Java做一个图像识别的东西,因此帮忙参考了网上资料写了一个基于Tess4J简单版的图像识别demo,供参考。 二、简单实例 1、首先创建一个新的maven项目(创建教程在此省略,自行百度),将所需jar包引入pom.xml <dependencies> <depende 阅读全文
posted @ 2020-05-08 14:51 贫民窟里的程序高手 阅读(3317) 评论(0) 推荐(0)

摘要: C# 识别文字我试验过的有两种,1.使用开源库tesseract,地址:https://github.com/tesseract-ocr/tesseracttesseract训练的语言包:https://github.com/tesseract-ocr/tessdata有专门针对C#的封装:http 阅读全文
posted @ 2020-05-08 14:46 贫民窟里的程序高手 阅读(25468) 评论(0) 推荐(6)

摘要: 图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号。 图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量注册的目的,但我觉得它最吸引我的地方是可以让一些书写的东西,自动识别成电脑上的文字,比如说手拟的合同 阅读全文
posted @ 2020-05-08 14:38 贫民窟里的程序高手 阅读(2553) 评论(0) 推荐(0)