python使用requests时使用RequestsCookieJar自动保存并传递cookie

使用python的requests开发爬虫类程序时,经常需要将之前请求返回的set-cookie值,作为下一个请求的cookie发送。比如模拟登录之后的返回的sessionId,就需要作为后续请求的cookie参数。

网上找了一圈,发现很多说需要手动添加或设置cookie的值。殊不知cookie是与域名、路径先关的,而且具有有效期。手动操作很容易掉坑里。。。

之前做C#时就有一个CookieContainer类可以自动处理cookie,照理requests的RequestsCookieJar应该也有类似的作用。研究了下发现其实requests组件确实具有自动处理cookie的能力,而且一句update代码就能搞定:

    def __init__(self):
        self.cookies = requests.cookies.RequestsCookieJar()

    def go(self, url, method, post_data):
            response = requests.request(method, url
                                        , data=post_data
                                        , headers=info.headers
                                        , cookies=self.cookies) #传递cookie

            self.cookies.update(response.cookies) # 保存cookie

 

posted on 2017-12-30 18:56  东篱南山  阅读(22275)  评论(0编辑  收藏  举报

导航