python——scrapy利用cookie模拟登录

python——scrapy利用cookie模拟登录
适用场景:cookie过期时间较长,足够你完成爬取过程

 

1、基础
2、找cookie,改start_urls
3、cookie转为字典
4、修改setting.py

> 1、基础

创建项目
```python
scrapy startproject 名称
```
生成爬虫
```python
scrapy genspider 爬虫名 允许爬取域名
```
运行
```python
scrapy crawl 爬虫名
```
> 2、找cookie,按F12寻找,一般在network的第一个包中;将start_urls改为豆瓣网址,以豆瓣为例

 

 

> 3、cookie转为字典,构造请求并把请求交给引擎,callback指定解析函数名称,默认为parse;cookie接受字典

 


> 4、更改setting中的user_agent和和注释掉ROBOTSTXT_OBEY

 

> 完成,部分结果截图

 

 

posted on 2022-01-04 22:39  子而  阅读(142)  评论(0编辑  收藏  举报