博客园 - 日天达人
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=45150
2023-12-12T08:56:27Z
日天达人
https://www.cnblogs.com/98WDJ/
feed.cnblogs.com
https://www.cnblogs.com/98WDJ/p/16571540.html
无原图滑动验证码2 - 日天达人
import xlwings as xw import pandas as pd import datetime import re import base64 import cv2 import pathlib import zipfile import shutil def down_pic(d
2022-08-10T02:51:00Z
2022-08-10T02:51:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】import xlwings as xw import pandas as pd import datetime import re import base64 import cv2 import pathlib import zipfile import shutil def down_pic(d <a href="https://www.cnblogs.com/98WDJ/p/16571540.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/16435060.html
retrying 模块 - 日天达人
安装 pip install retrying 简单使用 import random from retrying import retry @retry def do_something_unreliable(): if random.randint(0, 10) > 1: print("just
2022-07-01T08:13:00Z
2022-07-01T08:13:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】安装 pip install retrying 简单使用 import random from retrying import retry @retry def do_something_unreliable(): if random.randint(0, 10) > 1: print("just <a href="https://www.cnblogs.com/98WDJ/p/16435060.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/16164581.html
Xlwings 技巧随笔 - 日天达人
1.app基本设置 #是否可见,是否增加新的工作蒲 app = xw.App(visible=True, add_book=False) #是否进行屏幕更新,关闭后可以提升代码执行速度 app.screen_updating = True 2.打开Excel wb = app.books.open(
2022-04-19T03:54:00Z
2022-04-19T03:54:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】1.app基本设置 #是否可见,是否增加新的工作蒲 app = xw.App(visible=True, add_book=False) #是否进行屏幕更新,关闭后可以提升代码执行速度 app.screen_updating = True 2.打开Excel wb = app.books.open( <a href="https://www.cnblogs.com/98WDJ/p/16164581.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/15737328.html
Cv2识别无原图滑动验证码 - 日天达人
import cv2 def get_px(target_pic_path,template_pic_path): target_img = cv2.imread(target_pic_path, 0) template_img = cv2.imread(template_pic_path, 0)
2021-12-27T10:10:00Z
2021-12-27T10:10:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】import cv2 def get_px(target_pic_path,template_pic_path): target_img = cv2.imread(target_pic_path, 0) template_img = cv2.imread(template_pic_path, 0) <a href="https://www.cnblogs.com/98WDJ/p/15737328.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/14031029.html
日志模块 - 日天达人
import os import logging import time from logging import handlers class Logger(): level_relations = { 'debug':logging.DEBUG, 'info':logging.INFO, 'war
2020-11-24T08:33:00Z
2020-11-24T08:33:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】import os import logging import time from logging import handlers class Logger(): level_relations = { 'debug':logging.DEBUG, 'info':logging.INFO, 'war <a href="https://www.cnblogs.com/98WDJ/p/14031029.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/14031006.html
win32键盘模拟输入 - 日天达人
import os from PIL import ImageGrab # 获取当前目录 import time import sys import pandas as pd import win32api import win32con VK_CODE = { 'backspace': 0x08,
2020-11-24T08:31:00Z
2020-11-24T08:31:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】import os from PIL import ImageGrab # 获取当前目录 import time import sys import pandas as pd import win32api import win32con VK_CODE = { 'backspace': 0x08, <a href="https://www.cnblogs.com/98WDJ/p/14031006.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/14030456.html
JS获取元素的子元素 - 日天达人
1.定义和用法 :nth-child(n) 选择器匹配属于其父元素的第 N 个子元素,不论元素的类型。 n 可以是数字、关键词或公式。 <ul> <li>1</li> <li>2</li> <li>3</li> <li>4</li> </ul> 1 2 3 4 5 6 选取上面结构里面的li ul
2020-11-24T07:19:00Z
2020-11-24T07:19:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】1.定义和用法 :nth-child(n) 选择器匹配属于其父元素的第 N 个子元素,不论元素的类型。 n 可以是数字、关键词或公式。 <ul> <li>1</li> <li>2</li> <li>3</li> <li>4</li> </ul> 1 2 3 4 5 6 选取上面结构里面的li ul <a href="https://www.cnblogs.com/98WDJ/p/14030456.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/14030177.html
js iframe - 日天达人
JavaScript 在父窗口中获取iframe中的元素 1 2 3 4 5 6 7 8 9 10 11 格式:window.frames["iframe的name值"].document.getElementById("iframe中控件的ID").click(); 实例:window.frame
2020-11-24T06:37:00Z
2020-11-24T06:37:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】JavaScript 在父窗口中获取iframe中的元素 1 2 3 4 5 6 7 8 9 10 11 格式:window.frames["iframe的name值"].document.getElementById("iframe中控件的ID").click(); 实例:window.frame <a href="https://www.cnblogs.com/98WDJ/p/14030177.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/14023567.html
获取窗口句柄 - 日天达人
import win32guihwnd_title = dict()def get_all_hwnd(hwnd,tem): if win32gui.IsWindow(hwnd) and win32gui.IsWindowEnabled(hwnd) and win32gui.IsWindowVisib
2020-11-23T03:36:00Z
2020-11-23T03:36:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】import win32guihwnd_title = dict()def get_all_hwnd(hwnd,tem): if win32gui.IsWindow(hwnd) and win32gui.IsWindowEnabled(hwnd) and win32gui.IsWindowVisib <a href="https://www.cnblogs.com/98WDJ/p/14023567.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/13820475.html
python 从PDF中提取附件 - 日天达人
下载 Pdftk server:https://www.pdflabs.com/tools/pdftk-server/ 如果有密码,先把带密码的PDF的转成无密码的PDF pdftk 有密码.pdf input_pw 密码 output 无密码.pdf 如果不带密码,上一步可以跳过 提取附件(必须不
2020-10-15T06:43:00Z
2020-10-15T06:43:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】下载 Pdftk server:https://www.pdflabs.com/tools/pdftk-server/ 如果有密码,先把带密码的PDF的转成无密码的PDF pdftk 有密码.pdf input_pw 密码 output 无密码.pdf 如果不带密码,上一步可以跳过 提取附件(必须不 <a href="https://www.cnblogs.com/98WDJ/p/13820475.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/13813058.html
xlwings 使用方法 - 日天达人
# -*- coding: UTF-8 -*- 2 import xlwings as xw 3 4 wb = xw.Book() # 创建一个临时表格 5 sht = wb.sheets["sheet1"] # 创建sheet页 6 sht.range("A1").value = 1 # 给指定单
2020-10-14T01:41:00Z
2020-10-14T01:41:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】# -*- coding: UTF-8 -*- 2 import xlwings as xw 3 4 wb = xw.Book() # 创建一个临时表格 5 sht = wb.sheets["sheet1"] # 创建sheet页 6 sht.range("A1").value = 1 # 给指定单 <a href="https://www.cnblogs.com/98WDJ/p/13813058.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/12605353.html
基于KNN的发票识别 - 日天达人
项目概况: 有一个PDF文件,里面的每页都是一张发票,把每页的发票单独存为一个PDF并用该发票的的发票号码进行文件的命名,发票号码需要OCR识别,即识别下图中红色方块的内容。 一:拆分PDF 现有一个PDF文件,里面有很多张发票图片,每张发票占一页 我们先把这整个PDF拆分为单独的PDF 使用PyP
2020-04-01T08:05:00Z
2020-04-01T08:05:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】项目概况: 有一个PDF文件,里面的每页都是一张发票,把每页的发票单独存为一个PDF并用该发票的的发票号码进行文件的命名,发票号码需要OCR识别,即识别下图中红色方块的内容。 一:拆分PDF 现有一个PDF文件,里面有很多张发票图片,每张发票占一页 我们先把这整个PDF拆分为单独的PDF 使用PyP <a href="https://www.cnblogs.com/98WDJ/p/12605353.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/12396383.html
爬取漫画网站并进行图片拼接 - 日天达人
一切都要从一只蝙蝠说起。。 因为疫情原因,这个月远程办公(摸鱼),看漫画花了1000多大洋,看着自己的支付宝余额,起了白嫖的邪念。。 网上有些漫画网站,点击下一页的时候,会跳出某些网站,十分不便,而且每次换页都需要点击,所以我决定把漫画全都爬下来,每章拼接成一张长图,可以看得舒服一些 工具:pych
2020-03-02T09:44:00Z
2020-03-02T09:44:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】一切都要从一只蝙蝠说起。。 因为疫情原因,这个月远程办公(摸鱼),看漫画花了1000多大洋,看着自己的支付宝余额,起了白嫖的邪念。。 网上有些漫画网站,点击下一页的时候,会跳出某些网站,十分不便,而且每次换页都需要点击,所以我决定把漫画全都爬下来,每章拼接成一张长图,可以看得舒服一些 工具:pych <a href="https://www.cnblogs.com/98WDJ/p/12396383.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11851140.html
用python实现对元素的长截图 - 日天达人
一.目标 浏览网页的时候,看见哪个元素,就能截取哪个元素当图片,不管那个元素有多长 二.所用工具和第三方库 python ,PIL,selenium pycharm 三.代码部分 长截图整体思路: 1.获取元素 2.移动,截图,移动,截图,直到抵达元素的底部 3.把截图按照元素所在位置切割,在所有图
2019-11-13T09:25:00Z
2019-11-13T09:25:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】一.目标 浏览网页的时候,看见哪个元素,就能截取哪个元素当图片,不管那个元素有多长 二.所用工具和第三方库 python ,PIL,selenium pycharm 三.代码部分 长截图整体思路: 1.获取元素 2.移动,截图,移动,截图,直到抵达元素的底部 3.把截图按照元素所在位置切割,在所有图 <a href="https://www.cnblogs.com/98WDJ/p/11851140.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11752038.html
Selenium 配置IE浏览器 - 日天达人
1.安装selenium pip install selenium 2.安装IE浏览器driver http://selenium-release.storage.googleapis.com/index.html 进入索引页,首先选择版本号,IEDriverServer的版本号和Selenium的
2019-10-28T06:30:00Z
2019-10-28T06:30:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】1.安装selenium pip install selenium 2.安装IE浏览器driver http://selenium-release.storage.googleapis.com/index.html 进入索引页,首先选择版本号,IEDriverServer的版本号和Selenium的 <a href="https://www.cnblogs.com/98WDJ/p/11752038.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11284135.html
用python twilio模块实现发手机短信的功能 - 日天达人
前排提示:这个模块不是用于对陌生人进行短信轰炸和电话骚扰的,这个模块也没有这个功能,如果是抱着这个心态来的,可以关闭网页了 语言:python 步骤一:安装twilio模块 pip install twilio 步骤二:进入官网注册 https://www.twilio.com 注册完毕之后,会有一
2019-08-01T09:33:00Z
2019-08-01T09:33:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】前排提示:这个模块不是用于对陌生人进行短信轰炸和电话骚扰的,这个模块也没有这个功能,如果是抱着这个心态来的,可以关闭网页了 语言:python 步骤一:安装twilio模块 pip install twilio 步骤二:进入官网注册 https://www.twilio.com 注册完毕之后,会有一 <a href="https://www.cnblogs.com/98WDJ/p/11284135.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11283012.html
pdfplumber模块初始用 - 日天达人
pdfplumber 缺省通过表格线来区分行和列,所以下列情况是无法提取出表格的:* 你的表格是图片,通过选择可以确定是否图片* 你的表格不是用线来分隔,或者分隔不全,例如列用线,行没线这种情况下,你就需要尝试:page0.extract_tables(table_settings={})
2019-08-01T07:41:00Z
2019-08-01T07:41:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】pdfplumber 缺省通过表格线来区分行和列,所以下列情况是无法提取出表格的:* 你的表格是图片,通过选择可以确定是否图片* 你的表格不是用线来分隔,或者分隔不全,例如列用线,行没线这种情况下,你就需要尝试:page0.extract_tables(table_settings={}) <a href="https://www.cnblogs.com/98WDJ/p/11283012.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11226036.html
艺赛旗RPA-处理无表头表格 - 日天达人
今天写一个demo,要求是对表格数据用价格为key进行排序 样本数据有两种格式: 一.第一行是一个大单元格 处理步骤: 在不变参数的情况下读取表格数据: 结果如下: 可以看见表头: Unnamed: 4即为价格的表头,有了表头就可以用排序进行数据排列,把排列好的数据写入文件中 二.表格数据无表头 和
2019-07-22T07:18:00Z
2019-07-22T07:18:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】今天写一个demo,要求是对表格数据用价格为key进行排序 样本数据有两种格式: 一.第一行是一个大单元格 处理步骤: 在不变参数的情况下读取表格数据: 结果如下: 可以看见表头: Unnamed: 4即为价格的表头,有了表头就可以用排序进行数据排列,把排列好的数据写入文件中 二.表格数据无表头 和 <a href="https://www.cnblogs.com/98WDJ/p/11226036.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11225824.html
pandas - 日天达人
2019-07-22T06:51:00Z
2019-07-22T06:51:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】 <a href="https://www.cnblogs.com/98WDJ/p/11225824.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/98WDJ/p/11225793.html
NumPy - 日天达人
2019-07-22T06:46:00Z
2019-07-22T06:46:00Z
日天达人
https://www.cnblogs.com/98WDJ/
【摘要】 <a href="https://www.cnblogs.com/98WDJ/p/11225793.html" target="_blank">阅读全文</a>