2023年最新Python爬虫全套课程,百万年薪挑战券到手!零基础勿入! 爬虫逆向的认知
非对称加密算法 对称加密算法 消息摘要算法 数字签名算法
混淆: OB 混淆 JJ AA 变量名代码 JS报告 GS vmp GS 盗模 瑞索 5秒盾
APP端的逆向 抓包 没有网 抓得物,抓不到数据,返回的是底特,进行查壳
IOS 抓包功能 脱壳 反编译

了解逆向 数据加密 请求参数加密 请求头参数加密 data加密
元素 被渲染的数据 动态数据与静态数据 搜索(数据加密)
控制台 输出 运算1+1
源代码 html js css字体
网络 抓包
request 1.定位数据接口(control+f) 静态 | 动态 搜索不到
1.页面没有加载 多刷新 等待一下
2.静态页面字体加密 HTML实体编码
关键字(想爬取的内容)和元素里面的标签class="()"在源代码HTML里面搜索
3.数据加密 动态数据 ajax JSON.parse 一般在XHR里面
数据加密一般会有多接口,都采用那个加密方式,解密浏览器只会用JS
2.区分请求 方式 get 请求参数
post data
3.检索 headers data params 数据存在加密内容
4.构建 headers(合理)
5. 请求的发送
请求的时候不存在加密字段,请求失败,要通过下面接口校验的方式处理:data, headers, 请求方式
接口校验 路径 > XHR断点
1.url 的 com 后面是路径,复制路径 ,源代码 , XHR/提取断点 ,添加(+),黏贴 ,回车 ,页面刷新 ,在本地
里面 cacheURL 查看是否出现路径关键字 ,点击下一步 ,requestHeaders:请求头验证的数据,直接复制 > 粘贴到代码里 加引号,加逗号 记得移除断点
2.options:设置 type:"post"
3.控制台 options.data 可以查看data格式是字符串还是字典,小坑。 直接复制 粘贴到代码里
JS 调试 关键字搜索
网络 启动器引导检索
扣JS Python改写js
Host: 主机地址与域名 Referer: 防盗链接 User-Agent: 浏览器类型

浙公网安备 33010602011771号