会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
心悦君兮君不知-睿
博客园
首页
新随笔
新文章
联系
管理
订阅
2020年3月26日
Python爬虫连载17-ItemPipeLine、中间件
摘要: 一、ItemPipeLine 1.爬虫提取出的数据存入item之后,item中保存的数据需要进一步处理,比如:清洗,去重,存储等 2.pipeline需要process_item函数 (1)process_item:spider提出来的item作为参数出入,同时传入的还有spider;此方法是必须
阅读全文
posted @ 2020-03-26 00:02 心悦君兮君不知-睿
阅读(292)
评论(0)
推荐(0)
公告