• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






努力爬行的小虫子

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2021年2月16日

模拟登录之豆瓣登录_维持会话
摘要: http/https协议特性:无状态。 没有请求到对应页面数据的原因: 发起的第二次基于个人主页页面请求的时候,服务器端并不知道该此请求是基于登录状态下的请求。 Cookie:用来让服务器端记录客户端的相关状态。 -手动处理:通过抓包工具获取cookie值,将该值封装到headers中。(不建议) 阅读全文
posted @ 2021-02-16 22:10 努力爬行的小虫子 阅读(355) 评论(0) 推荐(0)
 
模拟登录之验证码识别
摘要: 验证码识别 反爬机制:验证码,识别验证码图片中的数据,用于模拟登录操作 验证码识别的操作:推荐第三方自动识别——超级鹰等 实战一:古诗文网登录页面中的验证码。 使用打码平台识别验证码的编码流程: -将验证码图片进行本地下载 -调用平台提供的示例代码进行图片数据识别 1 import requests 阅读全文
posted @ 2021-02-16 14:48 努力爬行的小虫子 阅读(354) 评论(0) 推荐(0)