处理cookie|py06

cookie与session

  • 用户登录,请求cookie
  • 带着cookie去请求网页,得到用户专属页面。
  • 使用session进行请求:session可以认为是一连串请求,在这个过程中cookie不会丢失;也可以认为session是记录用户的一系列操作。

一、获取

爬虫思路

注意: 如果login一闪而过或不出现,可以:

  • 输入一个错误的密码,然后可以看到login
  • 勾选Preserve log 和 DisableCache

分析程序

image.png

 从login包分析出,我们需要携带loginName和password参数去访问某个url,该url如下:

image.png

代码

import requests

session = requests.session()
data = {
    "loginName": "18663618755",
    "password": "w1ghkgcm"
}

url = "https://passport.17k.com/ck/user/login"
resp = session.post(url,data=data)
print(resp.text)

 得到的数据包如下:

image.png

 一般code=0表示访问成功,“succ”。

image.png

 从返回的数据中我们还可以看到用户名等登录信息。

 通过

print(resp.cookies)

可以看到客户端返回的cookie,和浏览器抓包的cookie相同。

image.png

提取书架中的信息

1)分析

image.png

 可以看到,我们想要的数据并没有在页面源代码中。

 最后在这里发现想要的书架信息。

image.png

image.png

2)代码编写

image.png

注意: 要用session.get而不是request.get,后者是重新发起一个请求,并没有携带cookie,因此取不到想要的信息,如果一定要用request呢?

image.png

 也可以加上cookie,第一种方法本质上也是这样的,只是写起来更简洁。

posted @ 2022-11-14 21:07  钱有学  阅读(23)  评论(0)    收藏  举报