[原理分析]Linux下的栈溢出案例分析-GDB调试操练[1]

摘要:
 本文主要演示linux平台下的栈溢出,首先依据理论对演示样例代码进行溢出攻击;结果是溢出攻击成立,可是与设想的有区别。然后採用GDB调试工具对发生的意外。进行深入的分析。

測试的平台:
1.  ubuntu 9;   gcc 4.4.1;   Gdb 7.0-ubuntu
2.  ubuntu系统安装在virtual box 3.2.8虚拟机上。

演示样例代码例如以下:

#include<string.h>
void overflow(char* arg)
{
	char buf[12];
	strcpy(buf, arg);
}

int main(int argc, char *argv[])
{
	if(argc > 1)
		overflow(argv[1]);
	return 0;
}

假设依照一般的方式编译:
gcc –o stackoverflow stackoverflow.c
linux系统可以探測到程序中的stack  overflow,从而终止程序,例如以下图所看到的:

那有没有办法让系统不探測到stack overflow。此处能够在编译时,禁用堆栈保护,详细命令例如以下:
gcc –fno-stack-protector –o stackoverflow stackoverflow.c
然后採用gdb调试stackoverflow,

这里的输出跟设想的存在非常大的区别,由于设想中的函数栈例如以下:

前面的12个字节填充buf,然后接下来的4个字节填充ebp,最后的4个字节填充RET地址。那么照理说,这里的eip应该是0x65656565,那为什么此处是0x61616161,刚好是aaaa的值呢?

依据单步调试的结果。发现eip变为0x61616161是在main函数退出后达到的,依照设想应该是在overflow退出时。eip变为0x65656565。

为什么overflow退出后还能回到main函数?可能的原因:输入的字符串没有覆盖掉ret地址,可是字符串却意外地将main的返回地址给覆盖掉了?

但就算是覆盖,为什么覆盖的值没有採用e的值,而是採用的a的值?要知道a是在字符串的起始处?这点的确让人奇怪。

1. 我们还是採用一步步调试的方式来观察问题所在。先看下gcc编译后的反汇编代码:
使用到的命令:
set disassembly-flavor intel  //将汇编设定为intel风格;
disassemble main  //反汇编main函数。

Main函数:

1. push ebp
2. mvo ebp, esp
3. and esp, 0xfffffff0
4. sub esp, 0x10
5. cmp DWORD PTR [ebp+0x8], 0x1
6. jle  0x804841d <main+31>
7. mov eax, DWORD PTR [ebp+0xc]
8. add eax, 0x4
9. mov eax, DWORD PTR [eax]
10. mov DWORD PTR [esp], eax
11. call 0x80483e4 <overflow>
12. mov eax, 0x0
13. leave
14. ret

然后再来看下。overflow的反汇编代码,命令:disassemble overflow
Overflow函数:

1. push ebp
2. mov ebp, esp
3. sub esp, 0x28
4. mov  eax, DWORD PTR[ebp+0x8]
5. mov  DWORD PTR[esp+0x4], eax
6. lea  eax, [ebp-0x14]
7. mov  DWORD  PTR [esp], eax
8. call  0x804831c <strcpy@plt>
9. leave
10. ret


我们单步调试上述的指令,关注当中esp值的变化。

总图例如以下,后面是对当中每一步的分析:

在完毕main.1后,命令p $esp后,esp的值变为:Esp = 0xbffff438
Main.3后。esp的值变为0xbffff430,预计是用于对齐;
Main.4后,esp的值为0xbffff420;
Main.7-10,这里主要将argv[]的arg[1]字符串的首地址取出来。而且将其放置在esp中,此时esp的值为0xbffff420;

运行overflow.1后。esp的值变为:0xbffff41c,当中存放着main的下一条语句的地址。
通过命令:x $esp能够看到overflow返回的地址:
0xbffff41c   0x0804841d
Overflow.1运行后,esp的值变为0xbffff418,用于存放ebp的值;
Overflow.3运行后,esp的值变为0xbffff3f0,
Overflow.5-7运行后,将字符串的地址放置在3f0+0x4地址处,然后再将暂时字符串也即buf的首地址[ebp-0x14]放置在3f0地址处(当前的esp指向处);

运行完overflow.8后,我们查看buf起始处后,发现的确完毕了内容的赋值,命令例如以下:
X 地址。

运行完leave指令后,发现esp的值变为:0xbffff41c。刚好指向的返回main的地址;然后再运行ret指令后。发现esp变为0xbffff420。然后,程序跳回到main函数;

然后再运行main函数中的leave指令,依照设想中leave指令运行后。esp的值应该变为43c,指向main的返回地址;可是实际我们运行后,esp的值变为0xbffff404,当中的内容刚好是0x61616161。也就是aaaa的值;这里我们測试时使用的參数的头四个字符刚好是aaaa;

到这里为止,就明确整个问题的症结:
 Main函数中调用leave指令时。esp的值并没有调整到位。本来应该指向43c(前面的地址忽略)的,此处却指向的404?
 那么为什么会产生这种状况?照理说这是编译器该干的事。为什么此处编译器没有尽责呢?

奇怪的是:
 不发生栈溢出时,也即我们输入的字符串长度不超过12时,main中的leave指令运行后,程序能够正常的返回到43c的位置,顺利退出。
 那这里的问题就非常奇怪了:栈溢出是发生在overflow中。程序能够从overflow中顺利返回到main中,然后main的leave指令就不正常了。假设overflow中没有栈溢出,程序也顺利返回到main函数,然后main的leave指令能够正常工作。

上述的问题的症结在于搞清楚leave指令本身;猜想其可能会依赖某些寄存器,或者依赖特定的存储单元来达到恢复目的。

首先看看能不能stepi进入leave;答案是leave是单条指令。不是一个处理函数;
所以我们试试能不能从寄存器上发现点什么。发现事实上对比vistual studio中的操作,
Leave指令应该等效为:
 Mov  esp, ebp
 Pop  ebp

之前关注的都是esp,那依照上面的等效的话,接下来应该关注ebp寄存器的变化。

所以,接下来要做的1. 首先验证上述的的等效成立,2. 要盯着ebp在运行过程中的变化。

对于问题1的验证,我们偷个懒,直接baidu之,发

posted on 2017-07-20 21:46  wgwyanfs  阅读(778)  评论(0)    收藏  举报

导航