遇到的反爬虫策略以及解决方法?

 

  • 通过headers反爬虫:自定义headers,添加网页中的headers数据。
  • 基于用户行为的反爬虫(封IP):可以使用多个代理IP爬取或者将爬取的频率降低。
  • 动态网页反爬虫(JS或者Ajax请求数据):动态网页可以使用 selenium + phantomjs 抓取。
  • 对部分数据加密处理(数据乱码):找到加密方法进行逆向推理。

 

posted @ 2019-07-16 01:01  anobscureretreat  阅读(744)  评论(0)    收藏  举报