处理cookie|py06
cookie与session
- 用户登录,请求cookie
- 带着cookie去请求网页,得到用户专属页面。
- 使用session进行请求:session可以认为是一连串请求,在这个过程中cookie不会丢失;也可以认为session是记录用户的一系列操作。
一、获取
爬虫思路
注意: 如果login一闪而过或不出现,可以:
- 输入一个错误的密码,然后可以看到login
- 勾选Preserve log 和 DisableCache
分析程序
从login包分析出,我们需要携带loginName和password参数去访问某个url,该url如下:
代码
import requests
session = requests.session()
data = {
"loginName": "18663618755",
"password": "w1ghkgcm"
}
url = "https://passport.17k.com/ck/user/login"
resp = session.post(url,data=data)
print(resp.text)
得到的数据包如下:
一般code=0表示访问成功,“succ”。
从返回的数据中我们还可以看到用户名等登录信息。
通过
print(resp.cookies)
可以看到客户端返回的cookie,和浏览器抓包的cookie相同。
提取书架中的信息
1)分析
可以看到,我们想要的数据并没有在页面源代码中。
最后在这里发现想要的书架信息。
2)代码编写
注意: 要用session.get而不是request.get,后者是重新发起一个请求,并没有携带cookie,因此取不到想要的信息,如果一定要用request呢?
也可以加上cookie,第一种方法本质上也是这样的,只是写起来更简洁。
浙公网安备 33010602011771号