摘要: 1.简单的反防爬虫:模拟浏览器登录 在发送请求是带上请求头headers: 常用请求头中的内容有headers={“User-Agent”:”...”,“host”:“...”,”referer”:”....”,自定义的,等等} 2.爬虫经验 经验一:当获取页面内容返回被防火墙拦截的时候,应当考虑在 阅读全文
posted @ 2018-07-04 20:01 Aberwang 阅读(88) 评论(0) 推荐(0)
摘要: 爬虫最常用的模块:requests Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是他不好用。一般情况下我们都会使用一个第三方模块requests来发送http请求。requests发送请求的方式一般有2 种,get请求和post请求. reque 阅读全文
posted @ 2018-07-04 18:15 Aberwang 阅读(150) 评论(0) 推荐(0)