此文很适合AA入门，看上去很长，但作者一直用一种比较诙谐的讲述方式，读下来并不难，而且本文的内容一点都不难。
本人英语渣，出现误译及错别字请多包涵。
原文地址：http://forum.cheatengine.org/viewtopic.php?t=95363

------------------------------
内容表
------------------------------

I. 介绍
II. 寄存器
II.a 32位寄存器
II.b 16位寄存器
III. 指令
III.a JMP
III.b MOV
III.c Push/Pop + The Stack
III.d alloc/label/registersymbol
III.e Call and Ret
III.f 其他
IV. Array of Bytes
V. 结尾
VI. 人员名单/致谢词

额外内容: 写一个脚本

------------------------------
I. 介绍
------------------------------
'哟，我猜你在读这个是因为下面两件事中的一个。

1) 你正在试图学习自动汇编 (我不会叫你菜鸟，因为每个人都是从哪里开始的，对吧 =) )
or
2) 你想测试你的自动汇编知识 (作为扩展)。

那么，如果你是前者，那就慢慢的体会好每个部分，并且在继续进行前确认自己已经明白了这章。

Dark Byte wrote:

大多数人都认为AA很难，其实它可容易了。

来自CE作者自己的话

如果是后者，那我不会给你提任何的建议，即使我想帮忙。如果你发现有什么错了，或者含糊或者认为我可以做的更好，请告诉我。我一直处于自我学习的状态! 等等！别问，我知道你在想什么。

You wrote:

为什么我非要听一个还在学习的人的话？

好，我来告诉你，我的朋友。即使我仍然在学习，我了解AA，并且我认为与你分享知识是一件很棒的事。 =)

Edit: 这个是很久以前写的，但是现在我学到了很多，并且已经重新检查了。

现在，让我们投身入奇幻的电脑世界

------------------------------
II. 寄存器
------------------------------

这些也许你已经在一些脚本中看到过，它们被非常广泛的使用。有两种寄存器被使用，接下来来进行讲解。

---------------
II.a 32 Bit
---------------

首先，我将解释每个寄存器是如何得到它们的名字的，这会帮助你记住它们哪个是哪个。首先，以E开头 (如果你注意了下面，你会发现所有的寄存器都是以E开头的) 它告诉你这个寄存器是32位寄存器。而A，B，C，D的含义你看完描述就能明显得体会到了。像SI， DI， BP，SP，IP也是一样。在 EAX， EBX， ECX， EDX后面的X，他简单的表示已经没有更多的字母了。有点像一个 NOP 命令 (之后你将读到)。如果你注意了，你会发现每个32位寄存器都是3个字母。

EAX: 累加器(Acculmulator register)。能够用来当存储器
EBX: 从前，它是个基础寄存器，但现在只是个闲着的存储器
ECX: 计数器(Counting register)。也能用来当存储器
EDX: 数据寄存器(Data register)。跟之前三个一样，能用来当存储器。
ESI: 源址变址寄存器(SourceIndex register)。是字符串形式的指针变量，但你现在还不用担心那部分。能够用来当存储器。
EDI: 目的变址寄存器(DestinyIndex register)。又一次，能够当作存储器，并且是个字符串形式的指针变量，但别担心。
EBP: 机制指针寄存器(Base Pointer register)。是用来临时存储ESP，当然也可以像常规的存储器那样使用。
ESP: 原址指针寄存器(Source Pointer register)。它在堆栈里指向寄存器和地址(这个内容待会再说)。
EIP: 指令指针寄存器(Instruction Pointer register)。错误的使用会使你正在试图修改的程序崩溃。

---------------
II.b 16 Bit
---------------

16位寄存器和32位寄存器很相似，他们间有两个区别。一是，32位寄存器名字是三个字母，而16位寄存器是两个字母。还有一件事就是16位寄存器比32位寄存器多但别担心。16位寄存器我们一般都用不上。

AX: 参照 EAX
BX: 参照EBX
CX: 参照ECX
DX: 参照EDX
SI: 参照ESI
DI: 参照EDI
BP: 参照EBP
SP: 参照ESP
IP: 参照EIP

---------------

关于寄存器的内容还很多。如果你想学习更多关于寄存器的只是，那就去拜Google大神吧。对于绝大多数的学习者来说求知欲都是很重要的。

------------------------------
III. 命令
------------------------------

当今，什么语言没有它自己的函数和命令呢? 与英文相比，命令像个单词，而操作代码像个句子。操作代码并不难，比如:

Code:

jmp 00123EAA

关于操作代码你应该知道两点。

首先，在操作码里，一般都会有个地址或者寄存器，以及一个显而易见的命令。地址是Hex形式的，是Hexadecimal的缩写。Hexadecimal是16进制数。就如同10进制那样。

按照这种思路想一想。如同上面提到的那样，我们一般使用十进制。这就意味着我们在一个列里不能有“10”，因为它占了两个地方。而16进制，10至15都可以放在一个列里头。但是你会发现，“10”并没有出现在列里头。

先冷静，这是因为在Hex进制里，10是用A表示的，而11是用B，直到15是F。再往后，它就是10，然后11，直到1F，如果超过了20(十进制)就得从15(十六进制)往后算。有个简单的转换方法就是用操作系统自带的计算器，这里不赘述了。

还有，每一个地址都有它的操作码和字节码。这个字节数就是代表操作码是什么，每一个命令都一一对应已经定义好的字节码。我知道那些常用函数的字节码是什么，如果你想知道那些字节码的话，你还是指望别人吧，推荐去拜Google大神 =)

最后，想注释很方便。要注释的话，就把"//"放在命令后边或某块空处，然后打上你想打的。如果你不打 "//" ，那电脑就会以为你在打命令呢。

现在，让我们来了解每个命令都是干啥的。
---------------
III.a JMP
---------------

JMP 命令是最常使用的命令之一 (就如同 MOV 那样，接下来会讲)。也许你在操作码和脚本里看到的"JMP" 不像"MOV" 那么多，那是因为 JMP 命令有很多变种。下面就是列表。

JMP: 始终跳转(Always jump to)
JE/JZ: 相等则跳转(Jump to if equal)
JNE/JNZ: 不等则跳转(Jump to if not equal)
JA: 无符号大于则跳转( Jump to if Above)
JG: 有符号大于则跳转(Jump to if Greater)
JNA: 无符号不大于则跳转(Jump to if not Above)
JNG: 有符号不大于则跳转(Jump to if not Greater)
JB: 无符号小于则跳转(Jump to if Below)
JL: 有符号小于则跳转(Jump to if Lower)
JNB: 无符号不小于则跳转(Jump to if not Below)
JNL: 有符号不小于则跳转(Jump to if not Lower)
JAE: 无符号大于等于则跳转(Jump to if Above or Equal)
JGE: 有符号大于等于则跳转(Jump to if Greater orEqual)
JNAE: 无符号不大于等于则跳转(Jump to if not Above orEqual (即 JB) )
JNGE: 有符号不大于等于则跳转(Jump to if not greaterthan or Equal (即JL) )

现在你大致了解了，应该有些疑惑。 "Jump to if greater"或者JG都是条件跳转。条件跳转都如同它们名字所描述的那样，会在条件成立的情况下跳转。通常，都会有CMP或者其他的比较函数在上面，这个待会再提。以上大抵就是JMP的故事。

---------------
III.b MOV
---------------

前文已经提过， MOV 命令是最被广泛实用的命令，因为它是那么给力。下面就是MOV的例子：

Code:

mov eax,ebx

这个的意思是 "把ebx里存的地址放到eax里"。注意在两个寄存器之间还有个逗号，而不是空格。最开始这可能有些令人费解，但是它真的很容易，下面来好好解释一下。

"Mov"是"move"的意思。寄存器自身表示"这个寄存器里存的地址"。基本上来说， "把ebx里存的地址放到eax的地址里面去"，这会把eax之前的值覆盖并彻底消灭掉。=D你可以通过这个方法复制ebx并把它粘贴到eax里。

另一种Mov命令。

Code:

mov eax,[ebx]

这个的意思是把ebx里面的值存到eax所存的地址里，很简单，把寄存器或者地址用[]那么一括，就表示寄存器或者地址的值了。
下面这段代码什么效果都没有。

Code:

mov [eax],[ebx]

没效果，上面的代码啥用没有。你不能！你不能直接把一个值存在另一个值里面。你可以间接得先把值存在其他的东西里 ;) 参考下面的代码。

Code:

  push eax                   //先让eax入栈—这个待会解释
  mov eax,[0100200A]    //把值0100200A存到eax里
  mov [ebx],eax             //把(值0100200A) 存到ebx的值里面
  pop eax                      //然后让eax出栈，这个也待会讲

解释这个是为了MOV函数。继续...

-----------------------------
Bonus. Writing a Script
------------------------------

既然你读了教程，那也应该很了解了，但你还是想知道更多。我明白，就如同我体会过的—遗憾。我不认为有任何关于写脚本的教程是我用的上的。

Code:

  [ENABLE]
  alloc(AutoAssembler,1024)
  alloc(SayWhat,1024)
  alloc(WooHoo,1024)
  label(Continue)
  registersymbol(WooHoo)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  cmp eax,[WooHoo]

  SayWhat:
  jmp 0
  [DISABLE]
  dealloc(AutoAssembler)
  dealloc(SayWhat)
  dealloc(WooHoo)
  unregistersymbol(WooHoo)

还记得之前的这个脚本吗? 现在让我们用我们所学的大量内容把它弄完整。

Code:

  [ENABLE]
  alloc(AutoAssembler,1024)
  alloc(SayWhat,1024)
  alloc(WooHoo,1024)
  label(Continue)
  registersymbol(WooHoo)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  cmp eax,[WooHoo]

  SayWhat:
  jmp 0

  [DISABLE]
  dealloc(AutoAssembler)
  dealloc(SayWhat)
  dealloc(WooHoo)
  unregistersymbol(WooHoo)

对于脚本你需要有些东西，一个你试图hack的程序的真实内存的地址。无论如何，它都不能是一个随机的地址，或者是一些你不希望它发生但是会导致其发生的地址(崩溃，也许)。这个地址对于这件事很重要。
但是为什么我们需要一个地址? 就如同之前我所说的，alloc 函数在你的程序中分配一块未使用内存。因为这是未使用的，程序不会访问这里，所以，你要让程序访问它。
当你干预这些地址时，你需要注意一些至关重要的事情。第一，你必须用与源码相同总量的字节。如何知道一个操作码字节的数量呢? 简单，看在地址和操作码中间，那儿应该有一堆两个一组两个一组的字符，他们被称为Array of Bytes。

nop 函数对于这种情况非常有帮助。就如同我之前解释的那样，它的含义是“无操作”。并且它只用一个字节。这意味着，如果你用不了所有的字节位置，那你就可以用nop把它填满。
当填字节时你可能会遇到三种情况。我已经描述了第一种你的代码比源码少的情况。剩下两种情况的一个是，你的代码所占的字节数和源码字节数相等，一切刚刚好。
但最后一种情况有些令人困惑，那就是你的代码的字节比源码的多。现在，你的代码的字节会把下面的代码字节覆盖，直到字节的位置够用。

为什么我们不玩Minesweeper呢? 一段时间之前，我还在学习写脚本的时候，我写了一小段代码(我还是我，但那时我还知道的很少)。

Code:

  [enable]
  alloc(WhatNowMinesweeper,256) //分配...
  alloc(ChiliDog,4)
  label(ReturnHere)
  registersymbol(ChiliDog)             //注册...

  ChiliDog:
  dd 0                                        //用于参考引用,表示ChiliDog的值是从0开始

  01002FF5:                               //这个地址是为MineSweeper写入时间的
  jmp WhatNowMinesweeper          //我重写了操作码，让它跳转到我的脚本
  nop                                        //填充了最后的字节
  ReturnHere:                            //这个是干什么的我待会告诉你

  WhatNowMinesweeper:             //我的实际代码
  push eax                                  //保存eax, 我们不这么做就会有问题
  mov eax,[ChiliDog]                   //把ChiliDog的值传入eax
  mov [0100579C],eax                //把存有ChiliDog值的eax存入时间
  pop eax                                  //让eax出栈,因为我们已经用完了
  jmp ReturnHere                         //跳转到ReturnHere, 待会解释

  [disable]
  dealloc(WhatNowMinesweeper)    //取消分配内存
  dealloc(ChiliDog)
  unregistersymbol(ChiliDog)          //反注册标识

  01002FF5:                               //这是我修改来跳入我的代码的地址
  inc [0100579C]                         //这是源操作码用以防止崩溃

现在，最最先要做的。我要告诉你"ReturnHere"是什么。如你所知，一个被告知要执行一个操作码的程序进程，他们会自动移动到下一个操作码，然后继续。这就如同一个无限的轮回。这样，如果我们弄了条死路，即代码之后已经没有代码了，那这个程序几乎就会崩溃。因此，我们要让它执行过我们的代码之后再返回到调用跳转之后的位置上，这样代码就可以继续了—并且我们也不会崩溃! =D
关于写脚本还有很多内容。请自由的提问并且评论你是否喜欢。 =)

本帖最后由 cn_zou 于 2011-1-8 14:20 编辑

---------------
III.c Push and Pop + The Stack
---------------

你已经看了上面的Push和Pop 命令的用法。等等！我是尤里！我能读你的思想！

You wrote:

那个push和pop都是干啥的?还有啥是stack?

好，你读了前文，在"Push"之后，我是这么注释的。

Code:

//Push eax onto the stack (让eax入栈)

这个基本上就是把eax存到堆栈里。而pop eax 基本上就是把eax从堆栈中清除。CEF的Skyone写了一个非常非常好的关于堆栈的解释，我甚至无法容忍自己不让你像我那样获得对此学习的快乐;)

Skyone wrote:

堆栈是用来存放可变的空白的值。它就如同: 你有用来做作业的一张纸，但是之后你的朋友打电话叫你给Phil打电话，他的电话是 555-6405。你慌了，没地方记啊，所以你把它写在了作业本上了。之后你撂下电话，就可以把Phil's电话写在电话薄上了。在写完号码之后，你就把号码从作业本用橡皮擦掉了，然后打电话给Phil，并且继续做作业。
把值push to stack (入栈)就是 "在作业本上写下Phil的电话号码" 而pop就是 "把电话号码录入到电话薄上，然后再从作业本上擦掉。"

继续...

---------------
III.d Alloc/Label/RegisterSymbol
---------------

我一般喜欢用两种方法来区分Auto Assembler脚本

1) 简单的地址改变

如同下面的简单代码：

Code:

  [enable]
  00ABC123:
  mov eax,ebx
  [disable]
  00ABC123:
  mov ebx,eax

这是在改变地址00ABC123里面的操作码。

但是也有非常复杂的脚本，就如同dICE 或 pID00的脚本。 (我不会在这里介绍，因为那真的没什么必要去学)

在非常复杂的脚本当中，你会在最顶上看到某些函数，(注意，我并没有经常使用)在一个复杂的脚本当中通常会出现"alloc"，"label"函数，有时还会出现"registersymbol"。

````````````
Label
````````````
我认为"label"函数是三个函数中最有重要的。他能够允许你用在脚本中使用"label"定义的变量，如同下面这样。 (摸丸：label用于定义用于跳转的标签)

Code:

  label(Continue)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  //...
  //...

  SayWhat:
  jmp 0 //insta-crash! =D

首先应该注意此脚本的一些问题，这个脚本没有 "alloc" 函数，之后我就讲

接着，如果你明白为什么程序执行了对应jne的label，那你做得不错。

注意所有的labels(跳转标签)都在我的脚本中定义了，否则他们不会编译。

````````````
Alloc
````````````

现在开始讲解"alloc"函数。它是用来按照你的设想来分配X量的内存的函数 (hence，alloc，allocate)。这些内存不是那些用过的，而是那些你在运行程序中可以覆盖的没有被使用的内存。就如同我说的，它会分配X量的内存。 X是个字节数的变量。1024bytes，或者1 kb(kilobyte) 一般就足够你用了。现在我们了解了alloc函数，让我来演示下如何来使用它，并利用之前所学到的一切。(摸丸：按照尺寸划分一块内存，并给它起个名字)

Code:

  alloc(AutoAssembler,1024)
  alloc(SayWhat,1024)
  label(Continue)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  //...

  SayWhat:
  jmp 0

注意为什么我不这么做

Code:

label(AutoAssembler)

或者

Code:

label(SayWhat)

因为当用alloc划分出内存的时候，他们在Cheat Engine的词典中就自动得已经定义好了，便于我们调用。

````````````
RegisterSymbol
````````````
最后，函数"registersymbol"。它可以添加你Cheat Table中你注册的标志。注意，你始终需要去为它分配内存。让我们在我们的脚本中试一试。

Code:

  alloc(AutoAssembler,1024)
  alloc(SayWhat,1024)
  alloc(WooHoo,1024)
  label(Continue)
  registersymbol(WooHoo)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  cmp eax,[WooHoo]

  SayWhat:
  jmp 0

````````````
Counterparts
````````````

现在，让我们来继续最后的一小段: the counterparts。

有两种使用AutoAssembler script的方法。第一种，你可以注入一些东西。第二种，你可以把它添加到Cheat Table中。如果你决定要把它填到cheat table (当今大多数脚本都是如此)，那你的代码需要enable和disable两部分代码，如下。

Code:

现在，你会注意到，Disable部分什么也没有，不过一会就不会了！;)

你在Disable部分中所想达到的就是：撤销你在Enable部分中所做的。
如何撤销内存分配和注册中的标记。现在，我感觉有个问题要来了

You wrote:

你是怎么办的?

简单来说，我的朋友。通过dealloc和 unregister symbol 函数! 哦，等等又有问题要来了。

"那label怎么办?" 你问?

嗯，没必要去撤销label。 =) 这意味着在Disable部分中，你大概要从开始那段中扔掉一半的代码! =)

那我们为什么不把学的加进脚本里呢?

Code:

  [ENABLE]
  alloc(AutoAssembler,1024)
  alloc(SayWhat,1024)
  alloc(WooHoo,1024)
  label(Continue)
  registersymbol(WooHoo)

  AutoAssembler:
  mov eax,02
  cmp eax,03
  jne Continue
  je SayWhat

  Continue:
  cmp eax,[WooHoo]
  [DISABLE]
  dealloc(AutoAssembler)
  dealloc(SayWhat)
  dealloc(WooHoo)
  unregistersymbol(WooHoo)

哦这儿...还有个问题。

You wrote:

为什么你不用那个"1024"了?

因为计算机知道你分配的AutoAssembler是大小为1024 bytes 的 (我们就把它当个例子试一试吧)，你只是需要deallocAutoAssembler，它就知道应该取消分配AutoAssembler的全部1024 bytes了。(很抱歉，解释的有些迷糊)

posted on 2018-01-12 10:23 白昊翔阅读(538) 评论(0) 收藏举报

刷新页面返回顶部

导航