此文很适合AA入门,看上去很长,但作者一直用一种比较诙谐的讲述方式,读下来并不难,而且本文的内容一点都不难。
本人英语渣,出现误译及错别字请多包涵。
原文地址:http://forum.cheatengine.org/viewtopic.php?t=95363
------------------------------
内容表
------------------------------
I. 介绍
II. 寄存器
II.a 32位寄存器
II.b 16位寄存器
III. 指令
III.a JMP
III.b MOV
III.c Push/Pop + The Stack
III.d alloc/label/registersymbol
III.e Call and Ret
III.f 其他
IV. Array of Bytes
V. 结尾
VI. 人员名单/致谢词
额外内容: 写一个脚本
------------------------------
I. 介绍
------------------------------
'哟,我猜你在读这个是因为下面两件事中的一个。
1) 你正在试图学习自动汇编 (我不会叫你菜鸟,因为每个人都是从哪里开始的,对吧 =) )
or
2) 你想测试你的自动汇编知识 (作为扩展)。
那么,如果你是前者,那就慢慢的体会好每个部分,并且在继续进行前确认自己已经明白了这章。
Dark Byte wrote: |
大多数人都认为AA很难,其实它可容易了。 |
来自CE作者自己的话
如果是后者,那我不会给你提任何的建议,即使我想帮忙。如果你发现有什么错了,或者含糊或者认为我可以做的更好,请告诉我。我一直处于自我学习的状态! 等等!别问,我知道你在想什么。
You wrote: |
为什么我非要听一个还在学习的人的话? |
好,我来告诉你,我的朋友。即使我仍然在学习,我了解AA,并且我认为与你分享知识是一件很棒的事。 =)
Edit: 这个是很久以前写的,但是现在我学到了很多,并且已经重新检查了。
现在,让我们投身入奇幻的电脑世界
------------------------------
II. 寄存器
------------------------------
这些也许你已经在一些脚本中看到过,它们被非常广泛的使用。有两种寄存器被使用,接下来来进行讲解。
---------------
II.a 32 Bit
---------------
首先,我将解释每个寄存器是如何得到它们的名字的,这会帮助你记住它们哪个是哪个。首先,以E开头 (如果你注意了下面,你会发现所有的寄存器都是以E开头的) 它告诉你这个寄存器是32位寄存器。而A,B,C,D的含义你看完描述就能明显得体会到了。像SI, DI, BP,SP,IP也是一样。在 EAX, EBX, ECX, EDX后面的X,他简单的表示已经没有更多的字母了。有点像一个 NOP 命令 (之后你将读到)。如果你注意了,你会发现每个32位寄存器都是3个字母。
EAX: 累加器(Acculmulator register)。能够用来当存储器
EBX: 从前, 它是个基础寄存器,但现在只是个闲着的存储器
ECX: 计数器(Counting register)。也能用来当存储器
EDX: 数据寄存器(Data register)。 跟之前三个一样,能用来当存储器。
ESI: 源址变址寄存器(SourceIndex register)。 是字符串形式的指针变量,但你现在还不用担心那部分。 能够用来当存储器。
EDI: 目的变址寄存器(DestinyIndex register)。又一次,能够当作存储器,并且是个字符串形式的指针变量, 但别担心。
EBP: 机制指针寄存器(Base Pointer register)。 是用来临时存储ESP, 当然也可以像常规的存储器那样使用。
ESP: 原址指针寄存器(Source Pointer register)。它在堆栈里指向寄存器和地址(这个内容待会再说)。
EIP: 指令指针寄存器(Instruction Pointer register)。 错误的使用会使你正在试图修改的程序崩溃。
---------------
II.b 16 Bit
---------------
16位寄存器和32位寄存器很相似,他们间有两个区别。一是,32位寄存器名字是三个字母,而16位寄存器是两个字母。还有一件事就是16位寄存器比32位寄存器多但别担心。16位寄存器我们一般都用不上。
AX: 参照 EAX
BX: 参照EBX
CX: 参照ECX
DX: 参照EDX
SI: 参照ESI
DI: 参照EDI
BP: 参照EBP
SP: 参照ESP
IP: 参照EIP
---------------
关于寄存器的内容还很多。 如果你想学习更多关于寄存器的只是, 那就去拜Google大神吧。 对于绝大多数的学习者来说求知欲都是很重要的。
------------------------------
III. 命令
------------------------------
当今,什么语言没有它自己的函数和命令呢? 与英文相比,命令像个单词,而操作代码像个句子。操作代码并不难,比如:
Code: |
jmp 00123EAA |
关于操作代码你应该知道两点。
首先, 在操作码里,一般都会有个地址或者寄存器,以及一个显而易见的命令。地址是Hex形式的,是Hexadecimal的缩写。Hexadecimal是16进制数。 就如同10进制那样。
按照这种思路想一想。如同上面提到的那样,我们一般使用十进制。这就意味着我们在一个列里不能有“10”, 因为它占了两个地方。 而16进制,10至15都可以放在一个列里头。但是你会发现,“10”并没有出现在列里头。
先冷静, 这是因为在Hex进制里,10是用A表示的,而11是用B,直到15是F。再往后,它就是10,然后11,直到1F, 如果超过了20(十进制)就得从15(十六进制)往后算。有个简单的转换方法就是用操作系统自带的计算器,这里不赘述了。
还有,每一个地址都有它的操作码和字节码。这个字节数就是代表操作码是什么, 每一个命令都一一对应已经定义好的字节码。我知道那些常用函数的字节码是什么,如果你想知道那些字节码的话,你还是指望别人吧,推荐去拜Google大神 =)
最后,想注释很方便。 要注释的话, 就把"//"放在命令后边或某块空处,然后打上你想打的。如果你不打 "//" ,那电脑就会以为你在打命令呢。
现在,让我们来了解每个命令都是干啥的。
---------------
III.a JMP
---------------
JMP 命令是最常使用的命令之一 (就如同 MOV 那样, 接下来会讲)。 也许你在操作码和脚本里看到的"JMP" 不像"MOV" 那么多,那是因为 JMP 命令有很多变种。下面就是列表。
JMP: 始终跳转(Always jump to)
JE/JZ: 相等则跳转(Jump to if equal)
JNE/JNZ: 不等则跳转(Jump to if not equal)
JA: 无符号大于则跳转( Jump to if Above)
JG: 有符号大于则跳转(Jump to if Greater)
JNA: 无符号不大于则跳转(Jump to if not Above)
JNG: 有符号不大于则跳转(Jump to if not Greater)
JB: 无符号小于则跳转(Jump to if Below)
JL: 有符号小于则跳转(Jump to if Lower)
JNB: 无符号不小于则跳转(Jump to if not Below)
JNL: 有符号不小于则跳转(Jump to if not Lower)
JAE: 无符号大于等于则跳转(Jump to if Above or Equal)
JGE: 有符号大于等于则跳转(Jump to if Greater orEqual)
JNAE: 无符号不大于等于则跳转(Jump to if not Above orEqual (即 JB) )
JNGE: 有符号不大于等于则跳转(Jump to if not greaterthan or Equal (即JL) )
现在你大致了解了,应该有些疑惑。 "Jump to if greater"或者JG都是条件跳转。 条件跳转都如同它们名字所描述的那样,会在条件成立的情况下跳转。通常,都会有CMP或者其他的比较函数在上面,这个待会再提。以上大抵就是JMP的故事。
---------------
III.b MOV
---------------
前文已经提过, MOV 命令是最被广泛实用的命令,因为它是那么给力。 下面就是MOV的例子:
Code: |
mov eax,ebx |
这个的意思是 "把ebx里存的地址放到eax里"。注意在两个寄存器之间还有个逗号,而不是空格。 最开始这可能有些令人费解,但是它真的很容易,下面来好好解释一下。
"Mov"是"move"的意思。 寄存器自身表示"这个寄存器里存的地址"。 基本上来说, "把ebx里存的地址放到eax的地址里面去", 这会把eax之前的值覆盖并彻底消灭掉。=D你可以通过这个方法复制ebx并把它粘贴到eax里。
另一种Mov命令。
Code: |
mov eax,[ebx] |
这个的意思是把ebx里面的值存到eax所存的地址里,很简单, 把寄存器或者地址用[]那么一括,就表示寄存器或者地址的值了。
下面这段代码什么效果都没有。
Code: |
mov [eax],[ebx] |
没效果,上面的代码啥用没有。你不能!你不能直接把一个值存在另一个值里面。你可以间接得先把值存在其他的东西里 ;) 参考下面的代码。
Code: |
push eax //先让eax入栈—这个待会解释 mov eax,[0100200A] //把值0100200A存到eax里 mov [ebx],eax //把(值0100200A) 存到ebx的值里面 pop eax //然后让eax出栈,这个也待会讲 |
解释这个是为了MOV函数。继续...
-----------------------------
Bonus. Writing a Script
------------------------------
既然你读了教程,那也应该很了解了,但你还是想知道更多。 我明白, 就如同我体会过的—遗憾。我不认为有任何关于写脚本的教程是我用的上的。
Code: |
[ENABLE] alloc(AutoAssembler,1024) alloc(SayWhat,1024) alloc(WooHoo,1024) label(Continue) registersymbol(WooHoo) AutoAssembler: mov eax,02 cmp eax,03 jne Continue je SayWhat Continue: cmp eax,[WooHoo] SayWhat: jmp 0 [DISABLE] dealloc(AutoAssembler) dealloc(SayWhat) dealloc(WooHoo) unregistersymbol(WooHoo) |
还记得之前的这个脚本吗? 现在让我们用我们所学的大量内容把它弄完整。
Code: |
[ENABLE] alloc(AutoAssembler,1024) alloc(SayWhat,1024) alloc(WooHoo,1024) label(Continue) registersymbol(WooHoo) AutoAssembler: mov eax,02 cmp eax,03 jne Continue je SayWhat Continue: cmp eax,[WooHoo] SayWhat: jmp 0 [DISABLE] dealloc(AutoAssembler) dealloc(SayWhat) dealloc(WooHoo) unregistersymbol(WooHoo) |
对于脚本你需要有些东西, 一个你试图hack的程序的真实内存的地址。 无论如何, 它都不能是一个随机的地址, 或者是一些你不希望它发生但是会导致其发生的地址(崩溃,也许)。这个地址对于这件事很重要。
但是为什么我们需要一个地址? 就如同之前我所说的,alloc 函数在你的程序中分配一块未使用内存。因为这是未使用的,程序不会访问这里,所以,你要让程序访问它。
当你干预这些地址时,你需要注意一些至关重要的事情。第一, 你必须用与源码相同总量的字节。 如何知道一个操作码字节的数量呢? 简单,看在地址和操作码中间,那儿应该有一堆两个一组两个一组的字符,他们被称为Array of Bytes。
nop 函数对于这种情况非常有帮助。就如同我之前解释的那样,它的含义是“无操作”。并且它只用一个字节。这意味着,如果你用不了所有的字节位置,那你就可以用nop把它填满。
当填字节时你可能会遇到三种情况。我已经描述了第一种你的代码比源码少的情况。剩下两种情况的一个是,你的代码所占的字节数和源码字节数相等,一切刚刚好。
但最后一种情况有些令人困惑,那就是你的代码的字节比源码的多。现在,你的代码的字节会把下面的代码字节覆盖,直到字节的位置够用。
为什么我们不玩Minesweeper呢? 一段时间之前,我还在学习写脚本的时候,我写了一小段代码(我还是我,但那时我还知道的很少)。
Code: |
[enable] alloc(WhatNowMinesweeper,256) //分配... alloc(ChiliDog,4) label(ReturnHere) registersymbol(ChiliDog) //注册... ChiliDog: dd 0 //用于参考引用,表示ChiliDog的值是从0开始 01002FF5: //这个地址是为MineSweeper写入时间的 jmp WhatNowMinesweeper //我重写了操作码,让它跳转到我的脚本 nop //填充了最后的字节 ReturnHere: //这个是干什么的我待会告诉你 WhatNowMinesweeper: //我的实际代码 push eax //保存eax, 我们不这么做就会有问题 mov eax,[ChiliDog] //把ChiliDog的值传入eax mov [0100579C],eax //把存有ChiliDog值的eax存入时间 pop eax //让eax出栈,因为我们已经用完了 jmp ReturnHere //跳转到ReturnHere, 待会解释 [disable] dealloc(WhatNowMinesweeper) //取消分配内存 dealloc(ChiliDog) unregistersymbol(ChiliDog) //反注册标识 01002FF5: //这是我修改来跳入我的代码的地址 inc [0100579C] //这是源操作码用以防止崩溃 |
现在,最最先要做的。我要告诉你"ReturnHere"是什么。 如你所知,一个被告知要执行一个操作码的程序进程,他们会自动移动到下一个操作码,然后继续。 这就如同一个无限的轮回。这样,如果我们弄了条死路,即代码之后已经没有代码了,那这个程序几乎就会崩溃。因此, 我们要让它执行过我们的代码之后再返回到调用跳转之后的位置上,这样代码就可以继续了—并且我们也不会崩溃! =D
关于写脚本还有很多内容。 请自由的提问并且评论你是否喜欢。 =)
本帖最后由 cn_zou 于 2011-1-8 14:20 编辑 --------------- III.c Push and Pop + The Stack --------------- 你已经看了上面的Push和Pop 命令的用法。等等!我是尤里!我能读你的思想!
好,你读了前文, 在"Push"之后,我是这么注释的。
这个基本上就是把eax存到堆栈里。而pop eax 基本上就是把eax从堆栈中清除。CEF的Skyone写了一个非常非常好的关于堆栈的解释,我甚至无法容忍自己不让你像我那样获得对此学习的快乐;)
继续... --------------- III.d Alloc/Label/RegisterSymbol --------------- 我一般喜欢用两种方法来区分Auto Assembler脚本 1) 简单的地址改变 如同下面的简单代码:
这是在改变地址00ABC123里面的操作码。 但是也有非常复杂的脚本,就如同dICE 或 pID00的脚本。 (我不会在这里介绍, 因为那真的没什么必要去学) 在非常复杂的脚本当中,你会在最顶上看到某些函数,(注意,我并没有经常使用)在一个复杂的脚本当中通常会出现"alloc","label"函数,有时还会出现"registersymbol"。 ```````````` Label ```````````` 我认为"label"函数是三个函数中最有重要的。 他能够允许你用在脚本中使用"label"定义的变量,如同下面这样。 (摸丸:label用于定义用于跳转的标签)
首先应该注意此脚本的一些问题,这个脚本没有 "alloc" 函数, 之后我就讲 接着,如果你明白为什么程序执行了对应jne的label,那你做得不错。 注意所有的labels(跳转标签)都在我的脚本中定义了,否则他们不会编译。 ```````````` Alloc ```````````` 现在开始讲解"alloc"函数。 它是用来按照你的设想来分配X量的内存的函数 (hence,alloc,allocate)。 这些内存不是那些用过的, 而是那些你在运行程序中可以覆盖的没有被使用的内存。 就如同我说的,它会分配X量的内存。 X是个字节数的变量。1024bytes, 或者1 kb(kilobyte) 一般就足够你用了。现在我们了解了alloc函数,让我来演示下如何来使用它,并利用之前所学到的一切。(摸丸:按照尺寸划分一块内存,并给它起个名字)
注意为什么我不这么做
或者
因为当用alloc划分出内存的时候,他们在Cheat Engine的词典中就自动得已经定义好了,便于我们调用。 ```````````` RegisterSymbol ```````````` 最后,函数"registersymbol"。 它可以添加你Cheat Table中你注册的标志。注意,你始终需要去为它分配内存。让我们在我们的脚本中试一试。
```````````` Counterparts ```````````` 现在,让我们来继续最后的一小段: the counterparts。 有两种使用AutoAssembler script的方法。第一种,你可以注入一些东西。第二种,你可以把它添加到Cheat Table中。如果你决定要把它填到cheat table (当今大多数脚本都是如此), 那你的代码需要enable和disable两部分代码,如下。
现在,你会注意到,Disable部分什么也没有,不过一会就不会了!;) 你在Disable部分中所想达到的就是:撤销你在Enable部分中所做的。 如何撤销内存分配和注册中的标记。现在,我感觉有个问题要来了
简单来说,我的朋友。通过dealloc和 unregister symbol 函数! 哦,等等又有问题要来了。 "那label怎么办?" 你问? 嗯,没必要去撤销label。 =) 这意味着在Disable部分中,你大概要从开始那段中扔掉一半的代码! =) 那我们为什么不把学的加进脚本里呢?
哦这儿...还有个问题。
因为计算机知道你分配的AutoAssembler是大小为1024 bytes 的 (我们就把它当个例子试一试吧),你只是需要deallocAutoAssembler,它就知道应该取消分配AutoAssembler的全部1024 bytes了。(很抱歉,解释的有些迷糊) |