导航

python——scrapy利用cookie模拟登录

python——scrapy利用cookie模拟登录
适用场景：cookie过期时间较长，足够你完成爬取过程

1、基础
2、找cookie，改start_urls
3、cookie转为字典
4、修改setting.py

> 1、基础

创建项目
```python
scrapy startproject 名称
```
生成爬虫
```python
scrapy genspider 爬虫名允许爬取域名
```
运行
```python
scrapy crawl 爬虫名
```
> 2、找cookie，按F12寻找，一般在network的第一个包中；将start_urls改为豆瓣网址,以豆瓣为例

> 3、cookie转为字典，构造请求并把请求交给引擎，callback指定解析函数名称，默认为parse；cookie接受字典

> 4、更改setting中的user_agent和和注释掉ROBOTSTXT_OBEY

> 完成，部分结果截图

posted on 2022-01-04 22:39 子而阅读(167) 评论(0) 收藏举报

刷新页面返回顶部

公告