scrapy 爬取时很多重复 及日志输出

Posted on 2018-12-14 11:25  豪顿  阅读(1452)  评论(0编辑  收藏  举报

日志输出参考:https://blog.csdn.net/weixin_41666747/article/details/82716688

 

首先 item 要设置循环外

第二,request 要设置下dont_filter=true  ,告诉爬取不要拒绝

最后一步,返回用yield item

 

Copyright © 2024 豪顿
Powered by .NET 8.0 on Kubernetes