2020 年 8月 30 日随笔档案 - gemoumou

2020年8月30日

摘要： scrapy的手动请求发送实现全站数据爬取 yield scrapy.Reques(url,callback) 发起的get请求 callback指定解析函数用于解析数据 yield scrapy.FormRequest（url,callback,formdata）发起的post请求 formdat 阅读全文

posted @ 2020-08-30 21:46 gemoumou 阅读(147) 评论(0) 推荐(0)

15-爬虫之scrapy框架基于管道实现数据库备份02

摘要：基于管道实现数据备份将爬取到的数据分别存储到不同的载体将数据一份存储到本地一份存储到mysql和redis 一个管道类对应一种形式的持久化存储操作，如果将数据存储到不同得载体中就需要使用多个管道类创建一个爬虫工程：scrapy startproject proName 进入工程目录创建爬虫源文阅读全文

posted @ 2020-08-30 17:25 gemoumou 阅读(142) 评论(0) 推荐(0)

14-爬虫之scrapy框架的基本使用01

摘要： scrapy框架简介：Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）的具有很强通用性的项目模板。对于框架的学习，重点是要学习其框架的特性、各个功能的用法即可。环境安装：阅读全文

posted @ 2020-08-30 00:31 gemoumou 阅读(121) 评论(0) 推荐(0)

gemoumou

公告