scrapy相关
摘要:
下面是些处理这些站点的建议(tips):使用user agent池,轮流选择之一来作为user agent。池中包含常见的浏览器的user agent(google一下一大堆)禁止cookies(参考COOKIES_ENABLED),有些站点会使用cookies来发现爬虫的轨迹。设置下载延迟(2或更... 阅读全文
posted @ 2015-06-10 10:46
diyihua
阅读(126)
评论(0)
推荐(0)