scrapy 基于管道持久化操作，分别存在本地和数据库

定义两个管道类，每个管道类中重写process_item(self, item, spider)

pipelines.py

# 这个类把数据保存进数据库
class save_to_db:
    def process_item(self, item, spider):
        # 要返回item给下一个类调用
        return item

# 这个类把数据保存到本地text文件
class save_to_text:
    def process_item(self, item, spider):
        return item

在管道中开启

ITEM_PIPELINES = {
   'learn_scrapy.pipelines.LearnScrapyPipeline': 300,
   'learn_scrapy.pipelines.save_to_db': 200,
   'learn_scrapy.pipelines.save_to_text': 300,
}

posted @ 2020-07-27 14:12 bibicode 阅读(141) 评论(0) 收藏举报

刷新页面返回顶部