摘要: 验证码破解 # 打码平台(自动破解验证码,需要花钱)云打码,超级鹰(12306) http://www.yundama.com/ http://www.chaojiying.com/ # 注册账号,(充钱)把demo下载下来,运行即可 以超级鹰为例 点击此处下载API,并解压就可以直接使用了 阅读全文
posted @ 2020-04-08 22:12 Hank·Paul 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 搭建免费代理池 https://github.com/jhao104/proxy_pool # 收费的:提供给你一个接口,每调一次这个接口,获得一个代理 # 免费:用爬虫爬取,免费代理,放到我的库中,flask,django搭一个服务(删除代理,自动测试代理可用性),每次发一个请求,获取一个代理 # 阅读全文
posted @ 2020-04-08 21:52 Hank·Paul 阅读(1763) 评论(0) 推荐(0) 编辑
摘要: 解析库beautifulsoup的介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库 #安装 Beautiful Soup pip install beautifulsoup4 #安装解析器 Beautiful Soup支持Python标准库中的HTML解 阅读全文
posted @ 2020-04-08 21:27 Hank·Paul 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 爬取汽车之家新闻 # 爬取汽车之家 import requests # 向汽车之家发送get请求,获取到页面 ret = requests.get('https://www.autohome.com.cn/news/1/#liststart') # print(ret.text) # bs4解析(可 阅读全文
posted @ 2020-04-08 20:32 Hank·Paul 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 数据分析 数据分析之Numpy 数据分析之pandas matplotlib画图 画图工具 阅读全文
posted @ 2020-04-08 08:56 Hank·Paul 阅读(169) 评论(0) 推荐(0) 编辑
摘要: request 模块基本使用 安装 pip install requests 1.发送http请求 # get,delete,post 本质都是调用request函数 ret = requests.get('http://www.baidu.com') print(ret.status_code) 阅读全文
posted @ 2020-04-08 08:39 Hank·Paul 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 网络状态码301与302 """ 301和302都是HTTP状态的编码,都代表着某个URL发生了转移。 301跳转,也叫“永久性转移”,301会把原网页权重转移到重定向目标的网站上面。 302跳转也称为,“临时性跳转”。 区别 1、使用效果不同 302跳转是暂时的跳转,搜索引擎会抓取新的内容而保留旧 阅读全文
posted @ 2020-04-08 08:27 Hank·Paul 阅读(1751) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/Anker/p/6056540.html 正向代理与反向代理 """ 正向代理是对客户端的代理,由客户端设立,客户端了解代理服务器和目标服务器,但是目标服务器不了解真正的客户端是谁;使用正向代理可以达到突破访问限制,提高访问速度,对服务器隐藏客户端ip 阅读全文
posted @ 2020-04-08 08:26 Hank·Paul 阅读(144) 评论(0) 推荐(1) 编辑
摘要: 垃圾回收机制 阅读全文
posted @ 2020-04-08 01:13 Hank·Paul 阅读(221) 评论(0) 推荐(0) 编辑