scrapy 爬取时很多重复 及日志输出

Posted on 2018-12-14 11:25  豪顿  阅读(1483)  评论(0)    收藏  举报

日志输出参考:https://blog.csdn.net/weixin_41666747/article/details/82716688

 

首先 item 要设置循环外

第二,request 要设置下dont_filter=true  ,告诉爬取不要拒绝

最后一步,返回用yield item

 

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3