常见的base64编码结果,便于一眼认出
例如:
http:aHR0cA==,https:aHR0cHM=,特征aHR0
{":eyI=,{"y:eyJ5,{"u:eyJ1,特征eyJ
今天让我们看看https://login1.scrape.center/(爬虫练习网站https://scrape.center/)
打开devtool,输入网址,然后会让登录,随便输入,然后点击登录,会有一个xhr数据包,负载携带参数token,并有特征eyJ:

直接用base64解密:

好了已经出来了,接下来让ai补充一下:
http 和 {",aHR0c 和 eyJ 确实是爬虫逆向中最实用的两个“指纹”。先记住它们:
aHR0c:https和http的通用特征。见到这个开头,十有八九是 URL。eyJ: 解密后通常是{",大概率是 JSON Web Token (JWT),直接去 jwt.io 解码会很有帮助。
基于这个思路,可以整理出更多实用特征:
🔎 更多Base64编码模式与特征速查表
Web/网络相关
| 特征开头 | Base64编码示例 | 解码后的常见含义 / 实战用途 |
|---|---|---|
aHR0 (HTTP(S)) |
aHR0cHM6Ly93d3cuYmFpZHUuY29t |
URL地址。网页请求或重定向 |
eyJ (JSON) |
eyJ1c2VyIjogImFkbWluIn0= |
JSON数据。常为API参数、JWT(eyJ开头) |
PGh0 (HTML) |
PGh0bWw+PGhlYWQ+... |
HTML源码。用于混淆模板或存储页面 |
R0lG (图片) |
R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7 |
GIF图片,数据URI方式内嵌网页 |
iVBO (图片) |
iVBORw0KGgoAAAANSUhEUgAA... |
PNG图片,数据URI方式内嵌网页 |
SUQz (音频) |
SUQzBAAAAAABEVRYWFgAAA... |
MP3音频,用于音频数据嵌入 |
UEsD (压缩包) |
UEsDBAoAAAAA... |
ZIP压缩包。检测到常为HTML走私或恶意文件 |
编程/数据相关
| 特征开头 | Base64编码示例 | 解码后的常见含义 / 实战用途 |
|---|---|---|
YWN0 (Action) |
YWN0aW9uPWRlbGV0ZQ== |
程序动作。前端加密的操作指令 |
ZGF0 (Data) |
ZGF0YToxMjM0NTY= |
通用数据。泛指数据内容 |
ZnVu (Function) |
ZnVuY3Rpb24gY2hlY2tUaGlz... |
JavaScript函数。混淆核心逻辑 |
c2Vs (Select) |
c2VsZWN0ICogZnJvbSB1c2Vy |
SQL语句。潜在SQL注入或前端防篡改 |
JTJG (%) |
JTJG → %2F |
URL编码的斜杠。二次编码混淆参数 |
邮箱/编码相关
| 特征开头 | Base64编码示例 | 解码后的常见含义 / 实战用途 |
|---|---|---|
bWFp (Mail) |
bWFpbHRvOnRlc3RAZXhhbXBsZS5jb20= |
Email地址或mailto链接 |
cGh (Php) |
cGhwaW5mbw== |
PHP代码(特征 cGh 来自 php 的Base64) |
cHl (Py) |
cHl0aG9uIGNvZGUg |
Python代码(特征 cHl 来自 py 的Base64) |
特征速查表说明
上表列举了常见特征,编写正则提取时,可以重点匹配:以aHR0c、eyJ开头,以=或==结尾,且仅含A-Za-z0-9+/=的字符串。但要注意两点:
- 依赖场景判断:
PGh0解码后是<ht,通常在<div>、<script>等HTML标签附近出现,才更有可能是HTML源码。 - 区分相似编码:碰到以
A-Z、2-7和=为主的长串,可能不是Base64,而是Base32,需用对应方式解码。
🛠️ 实用工具与处理技巧
识别出是Base64后,可以借助工具或代码处理:
- 万能解码器CyberChef:CTF和爬虫逆向的神器,可以用
From Base64等模块处理数据。 - Python解码脚本:编写健壮的解码函数很重要。搜索时,可以先用正则
^[A-Za-z0-9+/]*={0,2}$筛选出候选字符串。
🎯 爬虫实战技巧:玩转双层Base64
有时网站会做双层Base64编码。例如对 admin 编码一次得 YWRtaW4=,再编码一次得 WVdSdGFXND0=。对方可能会用 atob、fromCharCode 等函数组合解码。
逆向时,如果发现解码后仍是乱码,可尝试再次解码,或寻找 atob(btoa()) 这类JS特征函数。
💎 总结
在爬虫逆向实战中,识别Base64编码的核心就是通过结尾的 = 和 aHR0c、eyJ 这类特征字符进行快速定位。
免责声明
本文仅供技术学习与研究目的,请勿用于任何商业用途或非法行为。本文所涉及的技术分析基于公开的前端代码,旨在帮助开发者理解Web安全与逆向工程技术。使用本文所述技术时,请确保遵守相关法律法规和目标网站的服务条款。作者不对因使用本文内容而产生的任何后果承担责任。
全文完
浙公网安备 33010602011771号