摘要: 代理 当我们美好的爬完一个页面之后,喝了一杯茶,决定再爬一次,提升成就感,这时候发现了居然爬不了了! 这是为什么? 因为有些网页他会做了一些反爬措施,你的ip爬取在单位时间内访问了过多次数。所以他就不让你爬了。这种情况我们就可以称之为,你的ip被他的服务器端给封掉了。 那么我们是不是可以通过某种手段 阅读全文
posted @ 2019-09-22 17:30 chanyuli 阅读(218) 评论(0) 推荐(0)
摘要: 模拟登录cookie操作 我们之前已经实现了模拟人人网登录,那么我们接下来是不是可以直接用requests模块获取登录成功的界面的内容? 于是我们就那这个url做了请求。 结果访问到的html依然是登录界面。 这就是http/https协议的特性:无状态 没有请求到对应页面数据的原因: ​ 发起的第 阅读全文
posted @ 2019-09-22 17:29 chanyuli 阅读(425) 评论(0) 推荐(0)
摘要: 模拟登陆 既然我们做到了识别验证码,那么我们就可以开始模拟登录了。 然后你就模拟登录上了。 阅读全文
posted @ 2019-09-22 17:27 chanyuli 阅读(207) 评论(0) 推荐(0)