爬虫&逆向--Day13&Day14--JS逆向核心案例(响应入口定位、JS逆向响应解密、JS逆向请求加密)
一、JS逆向课程介绍
逆向核心案例
-- JS逆向流程(原理)
--请求加密
--响应解密
逆向基础案例
--扣JS
--webpack
--补环境
-- 瑞数
-- 原型链
-- 滑块
-- Akamai
-- JSVMP
学习方法:
复盘课上项目
准备链接:
案例链接:https://ggzyfw.fujian.gov.cn/business/list/
-- 为了保持环境一致,避免出现不必要的问题,建议使用Google浏览器无痕模式
破解网站:https://www.swhysc.com/swhysc/news/company
快速生成爬虫代码:https://curlconverter.com/
-- 既是根据Ajax发送的请求链接的基本信息请求参数,请求体,请求头等,快速生成爬虫代码
画图网站:https://excalidraw.com/
--可以根据需要画出结构图
二、逆向案例之基本爬虫
补充知识点:
浏览器 --> 服务器发送请求有两种模式:
模式一:服务器从数据库取出来的数据,有可能直接把数据在服务器侧,就把数据塞到页面中,然后直接把该页面进行返回。比如:百度热搜,热搜的数据就嵌在页面中,这时候就需要把该页面爬下来,然后用正则、XPass什么的对页面进行解析获取页面源码中的数据, ---这个是少数情况
模式二:浏览器向服务器发送一个请求,服务器先给浏览器返回一个页面(只有页面布局),但是核心数据没有,这个时候浏览器就需要通过Ajax再次发送请求,单独获取页面数据,再把数据加载到页面中。所以我们正常只需要进行对Ajax进行破解就好了,不需要进行正则什么的;需要用到正则、Xpass什么是数据嵌在页面中的。---该模式属于正常的大多数模式
1.1、技能一:学习排除干扰请求
通过点击页码获取的单个Ajax接口,除了单个参数页码不一样其他都一致
1.2、技能二:根据获取的接口,构建基础爬虫代码,发送请求
问题一:content-type:请求体的数据格式
res = requests.post(url=url, json=data, headers=header)
问题二:因为请求体全部内容已经复制包含,那提示的:接口请求签名错误,肯定是在请求头中,所以补充portal-sign
import requests # 基础爬虫,既是模仿Ajax发送数据请求,获取和浏览器一样的返回数据 # URL 请求方式 请求头 请求参数-get 请求体-post # 请求头 headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36", "portal-sign":"7c7cc7c720e63b573b1827244fd0cf12" } # 请求URL url = "https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo" # 请求体-post 点击复制--复制object data = { "pageNo": 3, "pageSize": 20, "total": 2755, "AREACODE": "", "M_PROJECT_TYPE": "", "KIND": "GCJS", "GGTYPE": "1", "PROTYPE": "", "timeType": "6", "BeginTime": "2025-02-08 00:00:00", "EndTime": "2025-08-08 23:59:59", "createTime": "", "ts": 1754618383170 } # 发送请求 # res = requests.post(url, data=data, headers=headers) data 会默认把请求体按照urlencoded去处理 参数校验错误 res = requests.post(url, json=data, headers=headers) # 所以,我们这里需要使用json处理 print(res.text) # 逆向--就是破解算法,算法是什么,就是各种加密 处理响应结果的加密
1.3、技能三:快速生成爬虫代码:https://curlconverter.com/
import requests headers = { 'Accept': 'application/json, text/plain, */*', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Type': 'application/json;charset=UTF-8', 'Origin': 'https://ggzyfw.fujian.gov.cn', 'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/', 'Sec-Fetch-Dest': 'empty', 'Sec-Fetch-Mode': 'cors', 'Sec-Fetch-Site': 'same-origin', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36', 'portal-sign': '30b786c2f4b4e6fa6b2c7e0da2b9bae9', 'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', } json_data = { 'pageNo': 1, 'pageSize': 20, 'total': 2757, 'AREACODE': '', 'M_PROJECT_TYPE': '', 'KIND': 'GCJS', 'GGTYPE': '1', 'PROTYPE': '', 'timeType': '6', 'BeginTime': '2025-02-08 00:00:00', 'EndTime': '2025-08-08 23:59:59', 'createTime': '', 'ts': 1754622577806, } url = "https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo" response = requests.post(url, headers=headers, json=json_data) print(response.text)
点击接口 --> 右键:复制 --> 选择:以cURL(bash)格式复制
三、逆向案例之响应入口定位
2.1、技能一:JS逆向流程(原理)
1、发送第一次请求:当通过浏览器第一次访问服务器获取数据
2、HTML+CSS+JS:服务器就会从数据库把浏览器第一次访问需要获取的HTML和CSS还有JS一起打包发送给浏览器,
其中HTML和CSS的浏览器页面布局相关,所以爬虫可以忽略;但是在返回的数据包中还有JS,JS是一种脚本语言,来自服务器,作用就是跟页面的动态事件相关,比如:弹窗、点击页码向后端发送Ajax请求获取分页数据等。【爬虫逆向重点关注通过JS向后端发送的Ajax请求数据和响应数据】
3.1、目标Ajax请求(浏览器):当页面渲染完成以后,我们通过点击【页码】发送Ajax请求,定位我们需要爬取的接口链接,
4.1、响应的Json数据(浏览器):服务器返回点击页码获取的新数据,返回的数据是加密的
3.2、目标Ajax请求(爬虫代码):通过Python代码模仿浏览对服务器进行发送请求,获取加密的响应数据
4.2、响应的Json数据(爬虫代码):通过Python代码模拟浏览器发送Ajax请求,获取服务器返回的加密数据
以上流程到此,已经获取到了服务器返回的数据,但是返回的数据是加密的,逆向既是对返回的数据进行解密,所以我们后续只需要重点关注【对返回的数据进行解密即可】,既然浏览器可以把加密的数据正常渲染,那么必定有一块JS代码是专门用来解密返回的数据的,所以我们需要定位到该段JS代码,并且通过代码模拟解密的过程,破解返回的加密数据
2.2、解密代码定位
1、搜索--嫌疑代码
通过以上操作,如果搜索:【 decrypt 】 定位到26个匹配行;如果搜索:【 decrypt( 】 定位到2个匹配行,然后在定位到的2个匹配行上打断点----{确定了两个嫌疑犯},然后再次点击页码进行确定是那个代码块,当点击完页码以后,那个断点卡住了就证明走了定位的那个方法----【确定了那个嫌疑犯才是罪魁祸首】,这个时候就找到了JS代码中针对返回的加密数据的处理方式,
2、定位嫌疑代码
3、分析解密代码
4、如何确定这段代码就是我们想要的呢?
e = h.a.enc.Utf8.parse(r["e"]) 得知 e 就是一个固定值,32位长度的字符串:"EB444973714E4A40876CE66BE45D5930" AES的key值
n = h.a.enc.Utf8.parse(r["i"]) 得知 i 就是一个固定值,16位长度的字符串:"B5A8904209931867" AES的iv值
t 是需要解密的数据{服务器返回的加密数据}
备注:加密知识可以参考 爬虫&逆向--Day08--加密算法
问题一:入口定位方式都有那些
-- 关键字搜索
-- 方法关键字
-- encrypt 加密
-- decrypt 解密 该案例解密使用的定位方式
-- key关键字(最高频)
-- headers关键字
-- 路径关键字
-- 拦截器关键字
-- 请求堆栈 标版,比较稳的一种方式,但是效率低
-- hook
四、逆向案例之Python逆向响应解密
import base64 from Crypto.Cipher import AES import json from Crypto.Util.Padding import unpad import requests headers = { 'Accept': 'application/json, text/plain, */*', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Type': 'application/json;charset=UTF-8', 'Origin': 'https://ggzyfw.fujian.gov.cn', 'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/', 'Sec-Fetch-Dest': 'empty', 'Sec-Fetch-Mode': 'cors', 'Sec-Fetch-Site': 'same-origin', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36', 'portal-sign': '95a50c89ade7a5a73c03127e52ea5a2c', 'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', } json_data = { 'pageNo': 2, 'pageSize': 20, 'total': 2795, 'AREACODE': '', 'M_PROJECT_TYPE': '', 'KIND': 'GCJS', 'GGTYPE': '1', 'PROTYPE': '', 'timeType': '6', 'BeginTime': '2025-02-11 00:00:00', 'EndTime': '2025-08-11 23:59:59', 'createTime': '', 'ts': 1754900503314, } response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data) # 这个获得的是字符串类型,所以不能操作,我们需要获取Json类型 # print(response.text) # print(type(response.text)) # <class 'str'> # 基于Python实现AES算法进行解密 # response.json() 获取的是字典类型 # print(type(response.json())) # <class 'dict'> # response.json().get("Data") 然后在get对应的key data = response.json().get("Data") # 先base64解码得到需要解密的数据,在进行解密 【知识点补充一】 data = base64.b64decode(data) k = "EB444973714E4A40876CE66BE45D5930".encode() # key可能是16位的,也可能是32位的, iv = "B5A8904209931867".encode() # iv一定是16位的 .encode()是一定要它的字节串 # 创建aes的对象 使用上面的一套 k 和 iv 既可以进行加密,也可以进行解密 aes_obj = AES.new(key=k, mode=AES.MODE_CBC, iv=iv) # AES解密 data = aes_obj.decrypt(data) # 得到的是b'xxx' 字节, data.decode()字节转字符串直接 # print("data::::", data) # 得到二进制字节数据 # data:::: b'{\r\n }\r\n ]\r\n}\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f' # data_str = data.decode() # 把二进制字节数据,转化为字符串 # 因为AES加密要求数据的长度必须是块大小的倍数,所以数据长度不足,需要进行填充(Padding) # json.loads(unpad(data, AES.block_size).decode('utf-8')) data_str = unpad(data, AES.block_size).decode('utf-8') # 因为AES带有填充,所以需要先用unpad去除填充 # print("data_str::::", data_str) # 把解密开的数据进行反序列化 字符串转字典 data_dict = json.loads(data_str) # print("data_dict::::", data_dict) # 所有的数据都在列表Table中,所以我们便利Table列表 print(data_dict.get("Table")) for i in data_dict.get("Table"): # 获取每个文件的NAME名称 print(i.get("NAME")) """ 【知识点补充一】 Base64编码,是由64个字符组成编码集:26个大写字母A~Z,26个小写字母a~z,10个数字0~9,符号“+”与符号“/” base64编码示例 # 将原始数据转化为二进制/字节数据 data = "you".encode("utf-8") print(data) # b'you' # 把字节转化成b64 bs = base64.b64encode(data).decode() print(bs) # eW91 base64解码示例 s = "eW91" ret = base64.b64decode(s) print(ret) # 正确 b'you' """
""" 【知识点补充二】 二进制字节---字符串 unpad(data, AES.block_size).decode('utf-8') 字符串---对象 json.loads(data_str) """
五、逆向案例之JS逆向响应解密
背景:由于本案例解密的JS代码块比较简单,所以我们可以通过上面的第四步:逆向案例之Python逆向响应解密 进行解密操作,但是当我们遇到JS解密代码比较繁琐和复杂的时候再用Python代码进行破解就比较麻烦,所以我们就需要把对应的解密代码块直接扣出来,在浏览器外部使用node进行运行。
5.1、确定JS中的解密代码块是那部分
5.2、补充和安装第三方依赖库 npm install crypto-js
如果没有安装crypto-js 需要安装一下 npm install crypto-js
JS中使用npm Python中使用pip 区别是:npm 放到当前目录下 pip放到全部python的安装包里面去
5.3、根据不考虑代码逻辑,只考虑在不改变代码逻辑的基础上,尽可能的代码替换和平移 替换 key 和 iv
5.4、测试扣出来的JS代码是否可行,如果可行后续就方便在Python中直接调用
5.5、在Python代码中调用JS解密代码,进行解密操作
备注: 有些有些中文不兼容问题 可能导致在执行 js_code_compile.call("b", data) Python调用JS代码时报错误,需要做如下操作
pip uninstall pyexecjs
pip install pyexecjs2
更新一下模块
5.6、创建的JS代码块文件:05案例基于JS的响应解密.js
/* JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js const cryptoJs 给导入的第三方标准库起一个名字,叫:cryptoJs 如果没有安装crypto-js 需要安装一下 npm install crypto-js JS中使用npm Python中使用pip 区别是:npm 放到当前目录下 pip放到全部python的安装包里面去 */ const cryptoJs = require("crypto-js") function b(t) { var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930") , n = cryptoJs.enc.Utf8.parse("B5A8904209931867") , a = cryptoJs.AES.decrypt(t, e, { iv: n, mode: cryptoJs.mode.CBC, padding: cryptoJs.pad.Pkcs7 }); return a.toString(cryptoJs.enc.Utf8) } /* 以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。 经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可 把上方代码中的 h.a 全部更换为: */ // 使用服务器返回的加密数据,进行对如上的代码进行测试 // data = "" // console.log(b(data)) // 调用修改后的加密方法,获取解密数据
5.7、创建的Python代码文件:04案例基于JS的响应解密.py
import execjs import requests headers = { 'Accept': 'application/json, text/plain, */*', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Type': 'application/json;charset=UTF-8', 'Origin': 'https://ggzyfw.fujian.gov.cn', 'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/', 'Sec-Fetch-Dest': 'empty', 'Sec-Fetch-Mode': 'cors', 'Sec-Fetch-Site': 'same-origin', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36', 'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa', 'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', } json_data = { 'pageNo': 1, 'pageSize': 20, 'total': 0, 'AREACODE': '', 'M_PROJECT_TYPE': '', 'KIND': 'GCJS', 'GGTYPE': '1', 'PROTYPE': '', 'timeType': '6', 'BeginTime': '2025-02-11 00:00:00', 'EndTime': '2025-08-11 23:59:59', 'createTime': '', 'ts': 1754910932790, } response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data) # print(response.text) # 基于JS实现AES算法进行解密 # 先打开,然后逐行读取JS代码 with open("05案例基于JS的响应解密.js", encoding="utf-8") as f: js_code = f.read() # execjs.compile 编译这个js代码 创建编译器 js_code_compile 可以调用JS代码中的任意一个函数 js_code_compile = execjs.compile(js_code) data = response.json().get("Data") # print("data:::",data) # 调用JS代码中的b函数,把data作为参数进行传递 res = js_code_compile.call("b", data) print(res) """ pip uninstall pyexecjs pip install pyexecjs2 更新一下模块 """
六、逆向案例之JS逆向请求加密
6.1、逆向请求加密操作的注解
6.2、定位本地JS代码中针对请求加密生成portal-sign的代码块,然后在爬虫中进行复现即可【MD5和Base84区别】
问题一:理论上我们定位加密,应该是搜索encrypt,但是该案例不可行
问题二:要求:每个人必须得认识md5值,base64值
--MD5值位数是固定的长度是32位的,
portal-sign:首先是32位,其次构成是0-9、a-f,没有f以后的字母是典型的MD5值
--base64位数是4的倍数,没固定的长度,数据越长位数越长
特点:base64只包含:0-9、a-z、A-Z / +
而且MD5是摘要算法,不是加密算法,所以我们如果想破解portal-sign就不应该搜索encrypt加密,AES、DES、RSA这些是加密算法,搜索encrypt是可以的,如果是MD5搜索encrypt正常是搜索不出来的。所以看到是MD5加密,就不应该去搜encrypt。
不相信你也可以搜索encrypt或者搜索MD5,首先是全局搜索,然后打断点,然后进行请求发送,一套流程走下来,会发现并没有走断点。所以以上的这些搜索都是不可用的,这时候我们就需要换个搜索方式:key关键字
在通过key关键字进行搜索的时候,该关键字越古怪越好,这样就方便在众多的代码中一眼找到定位到,如果key关键字不是很好找,还有个方式,就是搜索我们需要定位的比如Portal-Sign附近的比较怪异的词,然后迂回的方式在定位到我们的目标key,反正不管用什么手段目的只有一个,既是定位到我们需要找到的定位的那个key。
6.2.1、定位key关键词所在的JS代码中的位置
6.2.2、确定加密方法并进入
备注:到此其实我们就又回到了之前讲的,有两种处理方式,方式一用Python代码去模拟该加密,方式二直接扣JS代码进行环境补充平替,这里我们选择方式二。
6.2.3、扣出加密的JS代码,在外部使用node进行运行,缺什么环境补什么环境,方便后期使用Python代码进行调用
6.3.4、根据缺什么补什么的理念,使用node运行测试代码,报如下错误
问题一:拿任何的变量,断点需要在当前环境下,拿任何变量的值需要保证断点在当前函数内,所以我们想要哪一行的变量值,我们就把断点断在对应的行上
问题二:环境依赖,根据代码的依赖关系,补全环境
备注:同样的内容,MD5生成的内容是一样的
console.log(cryptoJs.MD5("123456").toString()) //e10adc3949ba59abbe56e057f20f883e /* 备注: cryptoJs.MD5("123456").toString() 调用的是toString s(n).toLocaleLowerCase() 调用的是toLocaleLowerCase 因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常 */
经过以上的确定和判断,我们可以直接使用我们的第三方库cryptoJs,替换方法n
由于数据data是一致的,所以数据通过MD5加密处理后的生成结果也必定是一致的,所以两边的结果应该是一致的
6.2.5、创建的JS代码块文件:05案例基于JS的响应解密.js
//****************************************************响应解密******************************* /* JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js const cryptoJs 给导入的第三方标准库起一个名字,叫:cryptoJs 如果没有安装crypto-js 需要安装一下 npm install crypto-js JS中使用npm Python中使用pip 区别是:npm 放到当前目录下 pip放到全部python的安装包里面去 */ const cryptoJs = require("crypto-js") function b(t) { var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930"), n = cryptoJs.enc.Utf8.parse("B5A8904209931867"), a = cryptoJs.AES.decrypt(t, e, { iv: n, mode: cryptoJs.mode.CBC, padding: cryptoJs.pad.Pkcs7 }); return a.toString(cryptoJs.enc.Utf8) } /* 以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。 经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可 把上方代码中的 h.a 全部更换为: */ // 使用服务器返回的加密数据,进行对如上的代码进行测试 // data = "" // console.log(b(data)) // 调用修改后的加密方法,获取解密数据 //****************************************************请求加密******************************* function l(t, e) { return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1 } function u(t) { for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++) if (void 0 !== t[e[a]]) if (t[e[a]] && t[e[a]] instanceof Object || t[e[a]] instanceof Array) { var i = JSON.stringify(t[e[a]]); n += e[a] + i } else n += e[a] + t[e[a]]; return n } function d(t) { for (var e in t) "" !== t[e] && void 0 !== t[e] || delete t[e]; var n = "B3978D054A72A7002063637CCDF6B2E5" + u(t); return cryptoJs.MD5(n).toString() } // 测试代码 // data = { // "ts": 1754982379972, // "pageNo": 2, // "pageSize": 20, // "total": 2800, // "AREACODE": "", // "M_PROJECT_TYPE": "", // "KIND": "GCJS", // "GGTYPE": "1", // "PROTYPE": "", // "timeType": "6", // "BeginTime": "2025-02-12 00:00:00", // "EndTime": "2025-08-12 23:59:59", // "createTime": "" // } // // console.log(d(data)) //console.log(cryptoJs.MD5("123456").toString()) //e10adc3949ba59abbe56e057f20f883e /* 备注: cryptoJs.MD5("123456").toString() 调用的是toString s(n).toLocaleLowerCase() 调用的是toLocaleLowerCase 因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常 */
6.2.6、创建的Python代码文件:06案例基于JS的响应解密.py
import execjs import requests import time headers = { 'Accept': 'application/json, text/plain, */*', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Type': 'application/json;charset=UTF-8', 'Origin': 'https://ggzyfw.fujian.gov.cn', 'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/', 'Sec-Fetch-Dest': 'empty', 'Sec-Fetch-Mode': 'cors', 'Sec-Fetch-Site': 'same-origin', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36', # 'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa', 这个就不在需要了 'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', } # 获取当前时间戳 # time.time() 10位的浮点型,所以需要乘以1000 # int(time.time()*1000) 在用int转换把小数点后面的删掉,等到13位的整型 # str(int(time.time()*1000)) 如何需要可以再次转换成字符串,【本案例不需要,本案例是数字所以转到int即可】 now = int(time.time()*1000)
json_data = { 'pageNo': 2, 'pageSize': 20, 'total': 0, 'AREACODE': '', 'M_PROJECT_TYPE': '', 'KIND': 'GCJS', 'GGTYPE': '1', 'PROTYPE': '', 'timeType': '6', 'BeginTime': '2025-02-11 00:00:00', 'EndTime': '2025-08-11 23:59:59', 'createTime': '', 'ts': now, } # (1)请求加密:基于json_data生成sign值 # 先打开,然后逐行读取JS代码 with open("05案例基于JS的响应解密.js", encoding="utf-8") as f: js_code = f.read() # 获取JS代码的编译器 js_compile = execjs.compile(js_code) # 通过JS代码编译器,调用d方法 sign = js_compile.call("d", json_data) # print("sign:::", sign) # 把生成的sign写入到请求头中 headers["portal-sign"] = sign response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data) print(response.text)
七、综合以上,最终代码如下
7.1、Python文件:07JS逆向最终版.py
07JS逆向最终版.py
import execjs import requests import time # 把冗余代码提出来 # 先打开,然后逐行读取JS代码 with open("05案例基于JS的响应解密.js", encoding="utf-8") as f: js_code = f.read() # 获取JS代码的编译器 js_code_compile = execjs.compile(js_code) headers = { 'Accept': 'application/json, text/plain, */*', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Type': 'application/json;charset=UTF-8', 'Origin': 'https://ggzyfw.fujian.gov.cn', 'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/', 'Sec-Fetch-Dest': 'empty', 'Sec-Fetch-Mode': 'cors', 'Sec-Fetch-Site': 'same-origin', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36', # 'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa', 这个就不在需要了 'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', } def get_one_page(page): # 获取当前时间戳 # time.time() 10位的浮点型,所以需要乘以1000 # int(time.time()*1000) 在用int转换把小数点后面的删掉,等到13位的整型 # str(int(time.time()*1000)) 如何需要可以再次转换成字符串,【本案例不需要,本案例是数字所以转到int即可】 now = int(time.time() * 1000) json_data = { 'pageNo': page, 'pageSize': 20, 'total': 0, 'AREACODE': '', 'M_PROJECT_TYPE': '', 'KIND': 'GCJS', 'GGTYPE': '1', 'PROTYPE': '', 'timeType': '6', 'BeginTime': '2025-02-11 00:00:00', 'EndTime': '2025-08-11 23:59:59', 'createTime': '', 'ts': now, } # (1)请求加密:基于json_data生成sign值 """ 冗余代码 # 先打开,然后逐行读取JS代码 with open("05案例基于JS的响应解密.js", encoding="utf-8") as f: js_code = f.read() # 获取JS代码的编译器 js_compile = execjs.compile(js_code) """ # 通过JS代码编译器,调用d方法 sign = js_code_compile.call("d", json_data) # print("sign:::", sign) # 把生成的sign写入到请求头中 headers["portal-sign"] = sign response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data) # print(response.text) # (2)响应解密:基于JS实现AES算法进行解密 """ 冗余代码 # 先打开,然后逐行读取JS代码 with open("05案例基于JS的响应解密.js", encoding="utf-8") as f: js_code = f.read() # 获取JS代码的编译器 js_code_compile = execjs.compile(js_code) """ data = response.json().get("Data") # 调用JS代码中的b函数,把data作为参数进行传递 res = js_code_compile.call("b", data) print("res:::", res) def main(): for i in range(1, 6): time.sleep(2) get_one_page(i) main()
7.2、JS文件:05案例基于JS的响应解密.js
05案例基于JS的响应解密.js //****************************************************响应解密******************************* /* JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js const cryptoJs 给导入的第三方标准库起一个名字,叫:cryptoJs 如果没有安装crypto-js 需要安装一下 npm install crypto-js JS中使用npm Python中使用pip 区别是:npm 放到当前目录下 pip放到全部python的安装包里面去 */ const cryptoJs = require("crypto-js") function b(t) { var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930"), n = cryptoJs.enc.Utf8.parse("B5A8904209931867"), a = cryptoJs.AES.decrypt(t, e, { iv: n, mode: cryptoJs.mode.CBC, padding: cryptoJs.pad.Pkcs7 }); return a.toString(cryptoJs.enc.Utf8) } /* 以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。 经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可 把上方代码中的 h.a 全部更换为: */ // 使用服务器返回的加密数据,进行对如上的代码进行测试 // data = "" // console.log(b(data)) // 调用修改后的加密方法,获取解密数据 //****************************************************请求加密******************************* function l(t, e) { return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1 } function u(t) { for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++) if (void 0 !== t[e[a]]) if (t[e[a]] && t[e[a]] instanceof Object || t[e[a]] instanceof Array) { var i = JSON.stringify(t[e[a]]); n += e[a] + i } else n += e[a] + t[e[a]]; return n } function d(t) { for (var e in t) "" !== t[e] && void 0 !== t[e] || delete t[e]; var n = "B3978D054A72A7002063637CCDF6B2E5" + u(t); return cryptoJs.MD5(n).toString() } // 测试代码 // data = { // "ts": 1754982379972, // "pageNo": 2, // "pageSize": 20, // "total": 2800, // "AREACODE": "", // "M_PROJECT_TYPE": "", // "KIND": "GCJS", // "GGTYPE": "1", // "PROTYPE": "", // "timeType": "6", // "BeginTime": "2025-02-12 00:00:00", // "EndTime": "2025-08-12 23:59:59", // "createTime": "" // } // // console.log(d(data)) //console.log(cryptoJs.MD5("123456").toString()) //e10adc3949ba59abbe56e057f20f883e /* 备注: cryptoJs.MD5("123456").toString() 调用的是toString s(n).toLocaleLowerCase() 调用的是toLocaleLowerCase 因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常 */
八、今日作业
破解网站:https://www.swhysc.com/swhysc/news/company