摘要: #!/usr/bin/env python3 # -*- coding: utf-8 -*- import glob from os import path import os import pytesseract from PIL import Image from queue import Qu 阅读全文
posted @ 2020-12-13 15:26 凹凸曼大人 阅读(406) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Jun 12 09:37:38 2018 利用百度api实现图片文本识别 @author: XnCSD """ import glob from os import p 阅读全文
posted @ 2020-12-13 15:21 凹凸曼大人 阅读(215) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Jun 12 09:37:38 2018 利用百度api实现图片文本识别 @author: XnCSD """ import glob from os import p 阅读全文
posted @ 2020-12-13 15:18 凹凸曼大人 阅读(606) 评论(2) 推荐(0) 编辑
摘要: 首先我是为了把这56w左右的数据清洗 变成这样: 从一个txt清洗,写到另一个txt中。 原本是几千条数据 ,一直用的普通的,速度还挺快,今天想清洗这56w数据,就想到了多线程 。 第一种方法: def huoqu(file): ts_queue = Queue(10000) with open(f 阅读全文
posted @ 2020-12-13 15:13 凹凸曼大人 阅读(266) 评论(0) 推荐(0) 编辑