python爬虫——模拟登录cookie与session

http/https协议特性:无状态

没有请求到对应页面数据的原因:

  发起的第二次基于个人主页页面请求的时候,服务器端并不知道该此请求是基于登陆状态下的请求。

cookie:用来让服务器端记录客户端的相关状态。

  —— 手动处理: 通过抓包工具获取cookie值, 将该值封装到headers中。(不建议)

  —— 自动处理:

    —— cookie值的来源是哪里?

      —— 模拟登录post请求后,由服务器创建

    —— session会话对象:

      —— 作用:

        1.可以进行请求的发送

        2.如果请求过程中产生了cookie,则该cookie会被自动存储/携带在该session对象中

    —— 创建一个session对象: session = requests.Session()

    —— 使用session对象进行模拟登录post请求的发送(cookie就会被存储在session中)

    —— session对象个人主页对应的get请求进行发送 (携带了cookie)

posted @ 2021-11-14 14:05  天叔  阅读(366)  评论(0)    收藏  举报