摘要: 1、爬取三国演义http://www.shicimingju.com/book/sanguoyanyi.html 代码: import requests from bs4 import BeautifulSoup res = requests.get('https://www.shicimingju 阅读全文
posted @ 2020-08-03 22:00 耗油炒白菜 阅读(106) 评论(0) 推荐(0)
摘要: # 1 验证码破解 图像处理 # 2 专业打码平台,破解验证码(收费) # 申请超级鹰,注册 # 登录,下载sdk(代码如下),填入用户名密码,软件id 将下载好的包中文件导入到项目 1、把py文件中的tab符号都替换掉,使用python3的话将prient改一下,再将用户名,密码,以及软件id输入 阅读全文
posted @ 2020-08-03 21:17 耗油炒白菜 阅读(457) 评论(0) 推荐(0)
摘要: 1、使用第三方(git clone下来) # github,下载免费代理池开源代码(建议读一下别人的代码) # https://github.com/jhao104/proxy_pool 2、运行起git clone的代理项目,安装必要依赖 # 项目根目录(pycharm终端) # pip3 ins 阅读全文
posted @ 2020-08-03 20:51 耗油炒白菜 阅读(297) 评论(0) 推荐(0)
摘要: 回顾: # 1 爬虫原理:发送请求 》解析 》入库 # 2 Http协议 -请求协议:请求首行(请求方法,请求版本号:1.1),请求头(客户端类型,referer,Connection: Keep-Alive,Cookie,自定制),请求体(编码格式:json,urlencoded,fromdata 阅读全文
posted @ 2020-08-03 15:33 耗油炒白菜 阅读(217) 评论(0) 推荐(0)