python爬虫——模拟登录cookie与session
http/https协议特性:无状态
没有请求到对应页面数据的原因:
发起的第二次基于个人主页页面请求的时候,服务器端并不知道该此请求是基于登陆状态下的请求。
cookie:用来让服务器端记录客户端的相关状态。
—— 手动处理: 通过抓包工具获取cookie值, 将该值封装到headers中。(不建议)
—— 自动处理:
—— cookie值的来源是哪里?
—— 模拟登录post请求后,由服务器创建
—— session会话对象:
—— 作用:
1.可以进行请求的发送
2.如果请求过程中产生了cookie,则该cookie会被自动存储/携带在该session对象中
—— 创建一个session对象: session = requests.Session()
—— 使用session对象进行模拟登录post请求的发送(cookie就会被存储在session中)
—— session对象个人主页对应的get请求进行发送 (携带了cookie)

浙公网安备 33010602011771号