常见的base64编码结果,便于一眼认出
例如:
http:aHR0cA==,https:aHR0cHM=,特征aHR0
{":eyI=,{"y:eyJ5,{"u:eyJ1,特征eyJ
今天让我们看看https://login1.scrape.center/(爬虫练习网站https://scrape.center/)
打开devtool,输入网址,然后会让登录,随便输入,然后点击登录,会有一个xhr数据包,负载携带参数token,并有特征eyJ
image
直接用base64解密:
image
好了已经出来了,接下来让ai补充一下:


http{"aHR0ceyJ 确实是爬虫逆向中最实用的两个“指纹”。先记住它们:

  • aHR0c: httpshttp 的通用特征。见到这个开头,十有八九是 URL。
  • eyJ: 解密后通常是 {",大概率是 JSON Web Token (JWT),直接去 jwt.io 解码会很有帮助。

基于这个思路,可以整理出更多实用特征:

🔎 更多Base64编码模式与特征速查表

Web/网络相关

特征开头 Base64编码示例 解码后的常见含义 / 实战用途
aHR0 (HTTP(S)) aHR0cHM6Ly93d3cuYmFpZHUuY29t URL地址。网页请求或重定向
eyJ (JSON) eyJ1c2VyIjogImFkbWluIn0= JSON数据。常为API参数、JWT(eyJ开头)
PGh0 (HTML) PGh0bWw+PGhlYWQ+... HTML源码。用于混淆模板或存储页面
R0lG (图片) R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7 GIF图片,数据URI方式内嵌网页
iVBO (图片) iVBORw0KGgoAAAANSUhEUgAA... PNG图片,数据URI方式内嵌网页
SUQz (音频) SUQzBAAAAAABEVRYWFgAAA... MP3音频,用于音频数据嵌入
UEsD (压缩包) UEsDBAoAAAAA... ZIP压缩包。检测到常为HTML走私或恶意文件

编程/数据相关

特征开头 Base64编码示例 解码后的常见含义 / 实战用途
YWN0 (Action) YWN0aW9uPWRlbGV0ZQ== 程序动作。前端加密的操作指令
ZGF0 (Data) ZGF0YToxMjM0NTY= 通用数据。泛指数据内容
ZnVu (Function) ZnVuY3Rpb24gY2hlY2tUaGlz... JavaScript函数。混淆核心逻辑
c2Vs (Select) c2VsZWN0ICogZnJvbSB1c2Vy SQL语句。潜在SQL注入或前端防篡改
JTJG (%) JTJG%2F URL编码的斜杠。二次编码混淆参数

邮箱/编码相关

特征开头 Base64编码示例 解码后的常见含义 / 实战用途
bWFp (Mail) bWFpbHRvOnRlc3RAZXhhbXBsZS5jb20= Email地址或mailto链接
cGh (Php) cGhwaW5mbw== PHP代码(特征 cGh 来自 php 的Base64)
cHl (Py) cHl0aG9uIGNvZGUg Python代码(特征 cHl 来自 py 的Base64)

特征速查表说明

上表列举了常见特征,编写正则提取时,可以重点匹配:以aHR0ceyJ开头,以===结尾,且仅含A-Za-z0-9+/=的字符串。但要注意两点:

  • 依赖场景判断PGh0 解码后是<ht,通常在<div><script>等HTML标签附近出现,才更有可能是HTML源码。
  • 区分相似编码:碰到以A-Z2-7=为主的长串,可能不是Base64,而是Base32,需用对应方式解码。

🛠️ 实用工具与处理技巧

识别出是Base64后,可以借助工具或代码处理:

  1. 万能解码器CyberChef:CTF和爬虫逆向的神器,可以用From Base64等模块处理数据。
  2. Python解码脚本:编写健壮的解码函数很重要。搜索时,可以先用正则 ^[A-Za-z0-9+/]*={0,2}$ 筛选出候选字符串。

🎯 爬虫实战技巧:玩转双层Base64

有时网站会做双层Base64编码。例如对 admin 编码一次得 YWRtaW4=,再编码一次得 WVdSdGFXND0=。对方可能会用 atobfromCharCode 等函数组合解码。

逆向时,如果发现解码后仍是乱码,可尝试再次解码,或寻找 atob(btoa()) 这类JS特征函数。

💎 总结

在爬虫逆向实战中,识别Base64编码的核心就是通过结尾的 =aHR0ceyJ 这类特征字符进行快速定位。



免责声明

本文仅供技术学习与研究目的,请勿用于任何商业用途或非法行为。本文所涉及的技术分析基于公开的前端代码,旨在帮助开发者理解Web安全与逆向工程技术。使用本文所述技术时,请确保遵守相关法律法规和目标网站的服务条款。作者不对因使用本文内容而产生的任何后果承担责任。


全文完