我对Padding Oracle Attack的分析和思考

道哥的《白帽子讲web安全》有一章提到Padding Oracle Attack的攻击方式，据说这货在2011年的Pwnie Rewards上还被评为"最具价值的服务器漏洞"。

抱着书看了半天，感觉也不是很理解，和密码学结合的比较紧，有一些理论的东西在里面。这里做个学习笔记，研究一下。

1. 相关阅读材料

https://github.com/GDSSecurity/PadBuster　　PadBuster - Automated script for performing Padding Oracle attacks

http://hi.baidu.com/aullik5/item/49ab45de982a67db251f40f6　　道哥的分析

http://www.di-mgt.com.au/cryptopad.html　　Padding原则

http://hi.baidu.com/306211321/item/faa44923c3c07d98b7326387　　分组密码的链接模式

http://blog.gdssecurity.com/labs/2010/9/14/automated-padding-oracle-attacks-with-padbuster.html　　作者写的分析

http://www.cnblogs.com/JeffreyZhao/archive/2010/09/25/1834245.html　　老赵写的分析(和ASP.NET结合)

http://www.isg.rhul.ac.uk/~kp/secretIV.pdf　　国外的牛牛写的分析(拓展Padding Oracle的知识面)

http://www.icylife.net/yunshu/attachments/Padding-Oracle-Attack.pdf　　云舒写的分析

http://netifera.com/research/poet/PaddingOraclesEverywhereEkoparty2010.pdf　　EKOPARTY 2010的演讲PPT

http://netsecurity.51cto.com/art/201101/244089_1.htm　　51CT上看到的分析

2. 前引知识

2.1 分组的填充Padding

分组密码Block Cipher需要在加载前确保每个每组的长度都是分组长度的整数倍。一般情况下，明文的最后一个分组很有可能会出现长度不足分组的长度:

这个时候，普遍的做法是在最后一个分组后填充一个固定的值，这个值的大小为填充的字节总数。即假如最后还差3个字符，则填充0x03。

这种Padding原则遵循的是常见的PKCS#5标准。http://www.di-mgt.com.au/cryptopad.html#PKCS5

2.2 CBC(Cipher Block Chaining CBC)模式

这是一种分组链接模式，目的是为了使原本独立的分组密码加密过程形成迭代，使每次加密的结果影响到下一次加密。这行可以强化加密算法的"敏感性"，即实现所谓的"雪崩效应"，在香浓理论中这就是"扰乱原则"。

之前在《密码学》课后做的笔记:http://hi.baidu.com/306211321/item/faa44923c3c07d98b7326387

这里我个人感觉要注意的一点是：

在链接模式中，初始化IV的长度要和对称加密算法的分组长度一致。原因是链接模式中的异或操作是等长操作。

3. Padding Oracle Attack攻击的原理

因为Padding Oracle Attack是针对CBC链接模式的攻击，和具体的加密算法无关(分组)。所以这里我们选择DES为例进行阐述。

假设明文为: LittleHann(明文长度为10 8 < 10 < 16 即使用2个分组)

经过DES加密(CBC模式)后，其密文为: EFC2807233F9D7C097116BB33E813C5E

加密程序: http://pan.baidu.com/s/1e2o7

密文采用了"ASCII十六进制的表示方法"，即两个字符表示一个字节的十六进制数。这是因为密码学算法中得到的密文经常会出现不可打印字符，为了保证在网络上传输的正确而不受不同系统间编码方案的影响，就有必要对密文进行"可视化"转化(即转化成可打印字符)。除了"ASCII十六进制的表示方法"之外，还可以采用"base64编码方法"。

PS：

这里插个题外话：PHP的DES及其他密码学算法的加密是通过"PHP加密扩展库Mcrypt"来实现的。

http://www.php100.com/cover/php/2651.html

http://baike.baidu.com/link?url=U8OtBP-IcYLRGrfWpSNhHskzrnA0qPNTsIrgGZcZSjLTGBPfpEI35ry51JtAXFxVuVsXKBK_UUZoXbZWgM-xLK

整个加密过程如下:

初始化向量IV与明文(第一组明文)XOR后，再经过运算得到的结果作为新的IV，用于下一分组(分组2)，如果迭代下去。

解密过程是加密过程的逆过程:

这里要注意，前几个分组的解密结果对我们都没有意义，我们重点关注的是最后一个分组的解密结果。看这张图可能会清楚一点:

注意到最后一个分组的末尾的数值为0x04，即表示填充了4个Padding。如果最后的Padding不正确(值和数量不一致)，则解密程序往往会抛出异常(Padding Error)。而利用应用的错误回显，我们就可以判断出Paddig是否正确。

这里有几个概念要先理清一下:

1. 基于密码学算法的攻击，往往第一个要搞清楚的是，我们在攻击谁，或者准确的说我们的攻击点在哪里？在一个密码学算法中，有很多的参数(指攻击者可以控制的参数)，攻击者往往是针对其中某一个或某一些参数进行破解，穷举等攻击。

在Padding Oracle Attack攻击中，攻击者输入的参数是IV+Cipher，我们要通过对IV的"穷举"来请求服务器端对我们指定的Cipher进行解密，并对返回的结果进行判断。

2. 和SQL注入中的Blind Inject思想类似。我觉得Padding Oracle Attack也是利用了这个二值逻辑的推理原理，或者说这是一种"边信道攻击(Side channel attack)"。http://en.wikipedia.org/wiki/Side_channel_attack

这种漏洞不能算是密码学算法本身的漏洞，但是当这种算法在实际生产环境中使用不当就会造成问题。

和盲注一样，这种二值逻辑的推理关键是要找到一个"区分点"，即能被攻击者用来区分这个的输入是否达到了目的(在这里就是寻找正确的IV)。

比如在web应用中，如果Padding不正确，则应用程序很可能会返回500的错误(程序执行错误)；如果Padding正确，但解密出来的内容不正确，则可能会返回200的自定义错误(这只是业务上的规定)，所以，这种区别就可以成为一个二值逻辑的"注入点"。

3. 攻击成立的两个重要假设前提:

1. 攻击者能够获得密文（Ciphertext），以及附带在密文前面的IV（初始化向量）
2. 攻击者能够触发密文的解密过程，且能够知道密文的解密结果

4. 可能出现的情况

明文分组和填充就是Padding Oracle Attack的根源所在，但是这些需要一个前提，那就是应用程序对异常的处理。当提交的加密后的数据中出现错误的填充信息时，不够健壮的应用程序解密时报错，直接抛出"填充错误"异常信息(这个错误信息在不同的应用中是不同的体现，在web一般是报500错误)。

攻击者就是利用这个异常来做一些事情，假设有这样一个场景，一个WEB程序接受一个加密后的字符串作为参数，这个参数包含用户名、密码。参数加密使用的最安全的CBC模式，每一个block有一个初始化向量IV(注意：这个IV在服务器第一次生成这个密文的时候就产生了，并保存在服务器上，攻击者需要在提交数据的时候也提交这个IV，后面我们会看到，攻击者实际上就是在"穷举"这个IV)。

当提交参数时，服务端的返回结果会有下面3种情况：
a. 参数是一串正确的密文，分组、填充、加密都是对的(程序运行本身没出问题)，包含的内容也是正确的(业务逻辑是对的)，那么服务端解密、检测用户权限都没有问题，返回HTTP 200。
b. 参数是一串错误的密文，包含不正确的bit填充(程序运行本身出现致命错误)，那么服务端解密时就会抛出异常，返回HTTP 500 server error。
c. 参数是一串正确的密文(程序运行本身没出问题)，包含的用户名是错误的(业务逻辑是错的)，那么服务端解密之后检测权限不通过，但是依旧会返回HTTP 200戒者HTTP 302，而不是HTTP 500。

攻击者无需关心用户名是否正确，只需要提交错误的密文(因为这里有4中变量情况，为了构造出二值逻辑推理，我们要定住其中2个情况，即让业务逻辑恒错，对Bit Padding的情况进行逻辑推理)，根据HTTP Code即可做出攻击。

我们继续回到原理分析上来。

假设有这样一个应用 http://sampleapp/home.jsp?UID=0000000000000000EFC2807233F9D7C097116BB33E813C5E

(中间用箭头隔开了，前面的16个字母(即8字节 ASCII十六进制表示法两个字母为一个字节)为攻击者输入的IV。后面的32个字母(即16字节)为攻击者输入的密文)

我们向服务器发送这样一个请求:

Request: http://sampleapp/home.jsp?UID=0000000000000000EFC2807233F9D7C097116BB33E813C5E

Respose: 500 - Internal Server Error

此时在解密时Padding是不正确的(填充的值和填充的数量不一致)

例如:

程序判断Padding是否出错一般是去检验末尾的那个字节的值，这里是0x3D，显然不对。这里我们再次回忆一下Padding原则:

1个字节的Padding为0x01

2个字节的Padding为0x02

3个字节的Padding为0x03

4个字节的Padding为0x04

5个字节的Padding为0x05

6个字节的Padding为0x06

7个字节的Padding为0x07

8个字节的Padding为0x08(当原始的明文正好是分组的整数倍的时候，Padding一个整组的填充值)

也就是说，Padding的值只可能是0x01~0x08之间。

接下来就是最关键的部分了，也是我一开始看比较难理解的地方。

我们接下来要利用选择密文攻击的思想，不断调整，修正IV。来对Intermediary Value进行猜测。

1) Padding 0x01

我们不断地调整IV的值，以希望解密后，最后一个字节的值为正确的Padding Byte，这里是0x01。因为Intermediary Value是固定的(我们此时不知道Intermediary Value)，因此从0x00~0xFF之间，只可能有一个IV的值与Intermediary Value的最后一个字节进行XOR后，结果是0x01(思考: 因为0x01只有最后1 bit为1，其他都是0，所以根据XOR的性质，只能存在一个值能XOR得到0x01)。攻击者通过遍历这255个值，可以找出IV需要的最后一个字节。

Request: http://sampleapp/home.jsp?UID=0000000000000066EFC2807233F9D7C097116BB33E813C5E

Respose: 200 OK

通过XOR运算，可以马上推导出此Intermediary Byte的值:

if(Inermediary Byte) ^ 0x66  == 0x01
{
       Inermediary Byte = 0x66 ^ 0x01                 
}
so:
        Inermediary Byte = 0x67

在回过头来看看加密过程:

初始化向量IV与明文进行XOR运算得到了Inermediary Value，因此将刚才得到的Inermediary Byte(0x67)与"真实"的IV的最后一个字节0x0F(攻击者事先获取到的)进行XOR运算，即能得到明文:

0x67 ^ 0x0F = 0x68 : H

即得到明文(第一个分组)的最后一个字母H！

这里咱们要稍微停一下，把思路理一理:

1. 我们在得出明文的那次XOR计算中用到的IV(0x0F)和我们攻击者不断"注入"的IV(0x01~0xFF)不是一回事，要区分开来。在计算明文的那个IV(0x0F)是我们事先就获取到的，回想我们之前说的这个Padding Oracle Attack攻击的成立条件:

这个IV(0x0F)是服务器端在发送密文的时候(可能是cookie形式)附带在密文的头部发给我们的。一般情况下，如果跨系统发送这种"带盐"的密文，都要把"盐(IV)"附带在密文的头部或其他位置一起发送给接收方。这里我们接收到的IV就是0x0F，在不同的环境中这个IV必然是不一样的，关键是要理解原理。

2. 为什么我们可以不断尝试IV？

按理来说，IV不是在服务器第一次生成这段密文的时候就生成好了吗？然后在每次发送的时候都附带在密文的头部，不会再变了......

的确是这样，但这说的是在正常的解密情况下发生的事，而我们攻击者现在做的事并不是在解密(事实上攻击者这个时候也不知道IV和KEY)，我们只是在通过不断的修改IV来对目标解密系统进行"试探"，从返回的结果来进行"侧信道攻击"，从而进行二值逻辑推理。

这就是一种所谓的"选择密文攻击"方式，好像也有叫Bit-Flipping Attack：

http://www.vnsecurity.net/2010/03/codegate-2010-challenge-8-bit-flipping-attack-on-cbc-mode/

继续回到思路分析上来:

在正确"匹配"了Padding 0x01之后，需要做的是继续推导出剩下的Intermediary Byte。根据Padding 原则，在需要Padding两个字节的时候，其值应该是0x02。

2) Padding 0x02

这个时候我们要注意，之前说过，这个攻击过程是个循环迭代的过程，上一步的结果就是作为下一步的基础。

我们之前已经知道Intermediary Byte的最后一个字节为0x61，因此可以"更新"IV(攻击者输入的IV)的第8个字节为 0x66 ^ 0x02 = 0x64。

(思考: 这个Padding Oracle Attack的过程中，攻击者需要不断地调整输入IV的值，之前因为在Padding 0x01中，我们只是在假设Padding 0x01的情况，在这个假设下，我们通过得出IV的最字节，从而计算出Intermediary Byte，进而算出明文的最后一个字节"H"。这里要注意的是，这个假设的IV没有任何意义，只是我们进行"选择密文攻击"过程中的一个路人甲而已。而接下来我们要继续假设Padding 0x02的情况，为了使在假设Padding 0x02中，Intermediary Value的最后一个字节依然为"0x67(之前算出来的)"，所以我们要对IV的最后一个字节进行迭代更新: 0x66 ^ 0x02 = 0x64)。

这个时候，本质上攻击者是固定住了IV的最后一个字节不变，开始循环"盲注"倒数第二个字节。开始依照第一步时的方法对倒数第二个字节进行"盲注"逻辑判断。

Request: http://sampleapp/home.jsp?UID=0000000000007064EFC2807233F9D7C097116BB33E813C5E

Respose: 200 OK

通过遍历可以得出，IV的第7个字节为0x70。

if(Inermediary Byte) ^ 0x70  == 0x02
{
       Inermediary Byte = 0x70 ^ 0x02                
}
so:
        Inermediary Byte = 0x72

对应的Intermediary Byte为0x72。知道了Intermediary Byte的倒数第二个字节为0x72，就可以得出明文的的倒数第二个字节:

0x72 ^ 0x17 = 0x65 : e

(这里的IV: 0x17是我们从服务端接收到的附带在密文头部的IV的倒数第二个字节)
接下来，要继续对IV进行假设，同理，这次"选择密文攻击"的假设是Padding 0x03，对IV进行迭代更新，然后对IV的倒数第三个字节进行"穷举"循环探测。

Padding 0x03

Padding 0x04

Padding 0x05

Padding 0x06

Padding 0x07

Padding 0x08

最终得到这个分组的明文LittleH。这是第一个分组的明文。

注意，Padding Oracle Attack是以单个分组进行的。到了这一步，我们会发现，我们的攻击目标其实就是那个临时中间值变量Intermediary Value，得到了这个值，再加上我们本来就可以获取到IV(服务器端生成的附在密文头部的那个IV)，我们可以通过XOR运算得到这个分组的明文。

对于多个分组的密文来说，我们继续观察一下CBC的解密流程:

第二个分组使用的IV(对于第一组来说是附带在密文头部的那段)是第一组分组的密文。因此我们就把第一组的密文带入带第二组的计算中。继续第对二组的Intermediary Value进行逻辑推导，最终得到第二组的密文:ann。

多分组的密文可以依次类推，由此即可以仅根据密文和IV还原出明文。

4. Padding Oracle Attack的攻击利用场景

一旦我们通过暴力破解得到中间值Intermediary Value之后，IV便可以用来生成我们想要的任意值。新的IV可以被放在前一个示例的前面，这样便可以得到一个符合我们要求的，包含两个数据块的密文了。这个过程可以不断重复，这样便能生成任意长度的数据了。

使用PadBuster加密任意的值

https://github.com/GDSSecurity/PadBuster

5. 模拟实验

这是道哥写的python脚本，可以用来模拟实验出Padding Oracle Attack的原理:

http://pan.baidu.com/s/1eitwK

可以参考源代码来进行深入的学习，加深理解。

6. 后记

自己按照书上讲的理解了一下，如有不对之处，望指正。

posted @ 2013-10-28 13:58 郑瀚阅读(6217) 评论(0) 收藏举报

刷新页面返回顶部

Han Zheng, Thinker and Doer

Welcome to contact me. Wechat：LittleHann

我对Padding Oracle Attack的分析和思考

公告