2019年3月13日

python爬虫 处理521状态码

摘要: 在抓取数据的时候往往可以通过状态码来判断返回结果,今天在抓取数据的时候碰到了以前没有碰到过得状态码521,输出它的爬取内容(text),发现是一些js代码。一起探讨一下如何处理521状态码。 用charles抓包的时候,发现浏览器对于同一网页连续访问了两次,第一次的访问状态码为521,第二次为200 阅读全文

posted @ 2019-03-13 17:40 GongShengM 阅读(1815) 评论(0) 推荐(0)

MAC上配置安装PhantomJs

摘要: 1.下载PhantomJS:http://phantomjs.org/download.html 2.下载后解压,配置环境变量: 打开终端 vim ~/.zshrc 按i键,进入编辑模式 添加 export PATH=/Users/****/Phantomjs/phantomjs/bin:$PATH 阅读全文

posted @ 2019-03-13 10:19 GongShengM 阅读(572) 评论(0) 推荐(0)

导航