—super—

博客园 首页 新随笔 联系 订阅 管理
  105 随笔 :: 0 文章 :: 0 评论 :: 33056 阅读
import pytesseract
from PIL import Image

im=Image.open('image.png')
print(pytesseract.image_to_string(im))

安装注意:
  环境变量需要配置两处
  1、path
  2、TESSDATA_PREFIX

初始路径
pytesseract.pytesseract.tesseract_cmd = 'd://Tesseract-OCR//tesseract.exe'
tessdata_dir_config = '--tessdata-dir "d://Tesseract-OCR//tessdata"'

图像切割识别
复制代码
im = Image.open(old_file)
R,C = im.size
newR = C//7
if right != 0:
    box = (left, low, right, high)
else:
    box = (left,low,R,high)
region = im.crop(box)
s = pytesseract.image_to_string(region,lang='chi_sim')
复制代码

 

posted on 2019-11-29 12:24  —super—  阅读(337)  评论(0)    收藏  举报
编辑推荐:
· [EF Core]聊聊“复合”属性
· 那些被推迟的 C# 14 特性及其背后的故事
· 我最喜欢的 C# 14 新特性
· 程序员究竟要不要写文章
· 一个被BCL遗忘的高性能集合:C# CircularBuffer深度解析
阅读排行:
· 我是不是很有钱?
· 遭遇疯狂 cc 攻击的一个周末
· 【EF Core】聊聊“复合”属性
· GPT‑5 重磅发布
· 美丽而脆弱的天体运动:当C#遇见宇宙混沌
点击右上角即可分享
微信分享提示