2019 年 5月 7 日随笔档案 - 答&案

2019年5月7日

摘要： Scrapy的日志等级请求传参 - 在某些情况下，我们爬取的数据不在同一个页面中，例如，我们爬取一个电影网站，电影的名称，评分在一级页面，而要爬取的其他电影详情在其二级子页面中。这时我们就需要用到请求传参。 - 案例展示：爬取www.id97.com电影网，将一级页面中的电影名称，类型，评分一级二阅读全文

posted @ 2019-05-07 17:48 答&案阅读(178) 评论(0) 推荐(0)

scrapy 递归解析和post请求

摘要：实现方案：使用Request方法手动发起请求。示例一实例二 post请求重写start_requests方法，让其发起post请求阅读全文

posted @ 2019-05-07 17:42 答&案阅读(379) 评论(0) 推荐(0)

scrapy管道持久化存储

摘要：持续化流程爬取糗事百科首页中的段子和作者的数据爬取下来,进行持久化存储爬虫文件:qiushibaike.py items文件: items.py 管道文件: pipelines.py 配置文件：settings.py 基于mysql的管道存储将item数据写入mysql数据库 pipeline 阅读全文

posted @ 2019-05-07 17:06 答&案阅读(564) 评论(0) 推荐(0)

公告