• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
oooooolr
You can do anything but not everything. ——David Allen
博客园    首页    新随笔    联系   管理    订阅  订阅
2019年3月1日
https://scrapingclub.com/exercise/basic_captcha/
摘要: 这次练习的过程中遇到了很多坑,大坑第一条:因为我每次都是在以前建好的project上直接修改请求地址,修改了starturl后没有修改Formrequest的导致一直获取不到验证码的地址,在scrapy shell试过很多次之后不明白为什么,后来换成xpath,xpath用的少,语法不熟悉又重新查看 阅读全文
posted @ 2019-03-01 16:52 oooooolr 阅读(310) 评论(0) 推荐(0)
https://scrapingclub.com/exercise/basic_login/
摘要: 遇到的问题:csrftoken cfduid 是在request.headers里面的,一直在找怎么在scrapy里get request.header,从scrapy shell ,then fetch then request.headers可以get正确的内容,但是scrapy project中,不知道怎么写代码,网上找到response.request.headers,这个写法,但是返回... 阅读全文
posted @ 2019-03-01 11:21 oooooolr 阅读(733) 评论(0) 推荐(0)
Python scrapy - Login Authenication Issue
摘要: https://stackoverflow.com/questions/37841409/python-scrapy-login-authenication-issue 阅读全文
posted @ 2019-03-01 10:44 oooooolr 阅读(198) 评论(0) 推荐(0)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3