2023年最新Python爬虫全套课程,百万年薪挑战券到手!零基础勿入! 爬虫逆向的认知

非对称加密算法  对称加密算法  消息摘要算法  数字签名算法

混淆:  OB 混淆  JJ  AA  变量名代码  JS报告  GS  vmp  GS  盗模  瑞索  5秒盾

APP端的逆向  抓包  没有网  抓得物,抓不到数据,返回的是底特,进行查壳

IOS 抓包功能  脱壳  反编译

 了解逆向  数据加密  请求参数加密  请求头参数加密  data加密

       元素  被渲染的数据  动态数据与静态数据  搜索(数据加密)

       控制台  输出  运算1+1

       源代码  html  js  css字体

       网络  抓包

       request  1.定位数据接口(control+f)  静态 | 动态  搜索不到  

1.页面没有加载  多刷新  等待一下

2.静态页面字体加密  HTML实体编码  

关键字(想爬取的内容)和元素里面的标签class="()"在源代码HTML里面搜索

3.数据加密  动态数据  ajax  JSON.parse  一般在XHR里面

  数据加密一般会有多接口,都采用那个加密方式,解密浏览器只会用JS

              2.区分请求 方式  get  请求参数

                      post  data

              3.检索  headers  data  params  数据存在加密内容

              4.构建 headers(合理)

              5. 请求的发送

请求的时候不存在加密字段,请求失败,要通过下面接口校验的方式处理:data, headers, 请求方式

       接口校验  路径   >   XHR断点

1.url 的 com 后面是路径,复制路径 ,源代码 , XHR/提取断点 ,添加(+),黏贴 ,回车 ,页面刷新 ,在本地

里面 cacheURL 查看是否出现路径关键字 ,点击下一步 ,requestHeaders:请求头验证的数据,直接复制 > 粘贴到代码里  加引号,加逗号  记得移除断点

2.options:设置  type:"post"

3.控制台  options.data  可以查看data格式是字符串还是字典,小坑。    直接复制  粘贴到代码里

      JS 调试  关键字搜索

             网络  启动器引导检索    

扣JS  Python改写js

Host:  主机地址与域名  Referer:  防盗链接  User-Agent:  浏览器类型

  

posted @ 2023-02-08 14:47  严永富  阅读(86)  评论(0)    收藏  举报