• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
oooooolr
You can do anything but not everything. ——David Allen
博客园    首页    新随笔    联系   管理    订阅  订阅

https://scrapingclub.com/exercise/detail_sign/

    def parse(self, response):
        # pattern1 = re.compile('token=(.*?);')
        # token = pattern1.findall(response.headers.getlist("set-cookie")[1].decode("utf-8"))[0]

        pattern2 = re.compile('token=(.*?);')
        token = pattern2.findall(response.headers.getlist("set-cookie")[1].decode("utf-8"))[0]
        token_md5= token.encode("utf-8")
        sign= hashlib.md5(token_md5).hexdigest()
        cookie = {
            'token': token,
        }
        url='https://scrapingclub.com/exercise/ajaxdetail_sign/?sign='+sign
        yield scrapy.Request(url= url,cookies=cookie,headers=header,callback=self.parse_json)

关键在于把token转成MD5

def get_md(url):
    m = hashlib.md5()
    m.update(url)
    return m.hexdigest()
copy from: https://www.jianshu.com/p/271b20f7574f

用到了其中的两句,不知道为什么要update,其中就像原作者说的,不能直接hashlib.md5(str)必须是byte,需要转码一次

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- focus on what you want to be
posted @ 2019-03-02 11:21  oooooolr  阅读(294)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3