摘要:
最近正在筹划爬取一些大型网站的数据,因为预想到这些网站的反爬措施比较多。首先筹备建立自己的一个代理池,手工测试了一下国内的开源的免费代理,发现西刺代理的可用率比较高,今天就写一个爬虫,爬取西刺代理可用的代理池。 步骤是:1.抓取西刺代理的网页文件2.通过正则解析代理3.通过访问baidu测试可用的代 阅读全文
posted @ 2019-05-04 16:15
CaptainWade
阅读(443)
评论(0)
推荐(0)