彩虹表的攻击与防御

预备知识

Hash：一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入（又叫做预映射pre-image）通过散列算法变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。后文所说的MD5算法是常用哈希算法之一，类似的还有MD5算法，SHA-1算法。

RainbowCrack：生成彩虹表的工具，是Philippe Oechslin 更快的时间记忆权衡技术的一般简易实现。能够实现：

1.全时间内存权衡工具套件，包括彩虹表生成，排序，转换和查找

2.支持任何哈希算法的彩虹表

3.支持任何字符集的彩虹表

4.支持原始文件格式（.rt）和压缩文件格式（.rtc）的彩虹表

5.计算多核处理器支持

6.使用NVIDIA GPU进行GPU加速（CUDA技术）

7.采用AMD GPU的GPU加速（OpenCL技术）

8.具有多个GPU的GPU加速

9.以及相应的系统兼容

MD5消息摘要算法（MD5 Message-Digest Algorithm）：一种被广泛使用的密码散列函数，可以产生出一个128位（16字节）的散列值（hash value），用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特（RonaldLinn Rivest）设计，于1992年公开，用以取代MD4算法。

实验目的

1）理解哈希算法的概念。

2）理解彩虹表攻击的原理以及进行相应实战。

3）掌握针对彩虹表攻击的防御要点。

实验环境

服务器：Windows 7 64位，IP地址：随机分配

辅助工具：Python2 IDE，RainbowCrack（1.7版本）

请在实验机内下载源码及软件：http://tools.hetianlab.com/tools/rainbow.zip

实验步骤一

在信息化时代，手机已经成为了我们生活中不可缺少的一部分，而我们的手机锁屏密码大部分都是4位数字的组合，在存在着防御暴力破解机制的前提下（例如多次尝试失败进行锁定），我们可以用怎样的加密机制来防止不怀好意的人破解我们的手机密码呢？同样，身为Cracker的你，怎样在别人无法察觉的情况下破解手机密码呢？

我们的任务分为3个部分：

1．以防御者的视角，编写对于4位密码进行md5加密的脚本，来抵御攻击者对密码的嗅探。

2．以攻击者的视角，通过生成相应的彩虹表来对4位数字密码MD5密文进行破解。

3．以防御者的视角，通过某种措施来抵御彩虹表破解或者使攻击者的破解难度和成本大大增加。

任务描述：使用任意一种语言，对特定的四位数字进行MD5加密(例如‘3839’)，输出加密后的结果：

注：具体MD5加密原理可以参照实验《Hash算法MD5分析》（http://www.hetianlab.com/expc.do?ec=81da3ca2-ae9d-4e85-b2a2-b6f217a150a0），在这里就不复现MD5的加密流程了

//示例程序运行截图：

实验步骤二

任务描述：使用给定的彩虹表生成工具RainbowCrack，生成破解四位数字组合MD5值的彩虹表，并对实验一中的MD5字符串进行破解。

1.彩虹表原理（对原理不感兴趣的同学可以直接跳到后面的操作阶段）：

1）时间和空间的折中（本节摘自CSND）

彩虹表预先建立一个可逆向的散列链并将其存储在表中，在破解时先查表得到可能包含结果的散列链，然后在内存中重新计算并得到最终结果。折中方式综合了计算暴力破解和查找表破解的优点，并将计算时间和存储空间降低到可以接受的范围。

以下图散列链为例，其中散列函数H将字符串转换成散列值，衰减函数R将散列值转换成字符串：

因此只需要存储第一个字符串aaaaaa和最后一个字符串kiebgt，我们就可以通过有限的计算还原整个散列链中所有的明文密码和散列值。这样可以减少所需要的存储空间。当我们获得一个用户密码的散列值，通过R运算可以得到一个字符串，然后通过查表的方式可以得到对应的散列链，从而还原用户明文密码。

例如，我们有密码散列值920ECF10，通过R函数可以得到字符串kiebgt，查表后我们得到散列链aaaaaa-kiebgt，然后在内存中还原整个散列链，因为我们只做了一次R运算，因此只需要找到kiebgt上一次使用R－H函数前的字符串就能得到用户的明文密码。

2）预先计算的散列链（本节摘自维基百科）

假设我们有一个哈希方程H和一个有限的密码集合P。我们需要预先计算出一个数据结构来帮我们决定哈希方程H的任意一个输出结果h是否可以通过密码集合P里面的一个元素p经哈希函数H(p) = h得到。实现这一目的的最简单的方法是计算出P集合内所有密码p的哈希值H(p)。但是这个方法要求Θ(|P|n)，（n代表哈希函数H的一个输出值的大小，对于较大的|P|，n会变得过高)字节的空间来储存结果。

哈希链可以用来减少对于储存空间的需求。大致想法是通过定义一个衰减函数（reduction function）R来影射散列值h在集合P中对应的密码p。（注意，这里的衰减函数并不是真正意义上哈希函数的反函数。)然后通过用衰减函数来替代哈希函数，形成交替的密码和哈希值。例如，如果P是6个字符的密码集合，而哈希值有32位长，那么他们形成的长链如下：