[你必须知道的.NET]第十四回:认识IL代码---从开始到现在

 

[你必须知道的.NET]

第十四回:教你认识IL代码---从开始到现在

发布日期:2007.8.22 作者:Anytao
©2007 Anytao.com
,原创作品,转贴请注明作者和出处。

本文将介绍以下内容:

·       IL代码分析方法 

·       IL命令解析 

·       .NET学习方法论


1. 
引言

    自从『你必须知道.NET』系列开篇以来,受到大家很多的关注和支持,给予了anytao巨大的鼓励和动力。俱往昔,我发现很多的园友都把目光和焦点注意在如何理解IL代码这个问题上。对我来说,这真是个莫大的好消息,因为很明显我们的思路慢慢的从应用向底层发生着转变,技巧性的东西是一个方面的积累,底层的探索在我认为也是必不可少的修炼。如果我们选择了来关注这项修炼,那么我们就应该选择如何来着手这项修炼,首先关注anytao的『你必须知道的.NET』系列可以给你提供一个捷径,少花一些功夫;其次对大师级的作品也应有更深入的了解,如《Applied Microsoft .NET Framework Programming》、《.NET本质论》;再次,就是像我一样从博客园和MSDN的知识库中不断的成长。呵呵,除了给自己做了个广告之外,我认为不管是何种途径,了解和认识IL代码,对于我们更深刻的理解.NET.NET应用之上的本质绝对有不一样的收获,这也就是本文研究和分享的理由。

    那么,我们要了解IL代码,就要知道了解IL的好处,时间对每个程序设计师来说都是宝贵的,你必须清楚自己投资的价值再决定投入的资本。对于.NET程序员来说,IL代码意味着:

·       通用的语言基础是.NET运行的基础,当我们对程序运行的结果有异议的时候,如何透过本质看表面,需要我们从本质入手来探索,这时IL是你必须知道的基础;

·       元数据和IL语言是CLR的基础,了解必要的中间语言是深入认识CLR的捷径;

·       大量的事例分析是以IL来揭密的,因此了解IL是读懂他人代码的必备基础,可以给自己更多收获。

    很明显这些优越性足以诱惑我们花时间和精力涉猎其中。然而,了解了IL的好处,并不意味着我们应该过分的来关注IL,有人甚至可以洋洋洒洒的写一堆IL代码来实现一个简单Hello world程序,但是正如我们知道的那样,程序设计已经走过了几十年的发展,如果纯粹的陶醉在历史中,除了脑子不好,没有其他的解释。不然看见任何代码都以IL的角度来分析,又将走进另一个误区,我们的宗旨是追求但不过分。

    因此,有了上述了应该了解的理由和不应该过分的基线,在摆正心态的前提下,本文开始以作者认为的方式来展开对IL代码的认识,作者期望通过本文的阐述与分析使得大家都能对IL有个概观之解,并在平时的项目实践中使用这种方法通过了解自己的代码来了解.NET。我想,这种方法应该是值得提倡和发挥的最佳实践,不知你信不信呢?呵呵。

2. 使用工具

    俗话说,工欲善其事,必先利其器。IL的器主要就是ILadsm.exereflector.exe,这两个工具都是了解IL的基础,其原理都是通过反射机制来查看IL代码。

·       ILadsm.exe

    打开.NET Framework SKD 命令提示行,输入ildasm回车即可打开,如图所示:

 

  
 上图是我们熟悉的《第十三回:从Hello, world开始认识IL》中的示例,其中的树形符号代表的意思,可以从MSDN的一张经典帮助示例来解释,如下图所示:

 


(图表来源:
MSDN

·       reflector.exe下载

    ReflectorLutz Roeder开发的一个让人兴奋的反编译利器,目前的版本是Version 5.0.35.0,可以支持.NET3.0,其功能也相当强大,在使用上也较ILDASM更加灵活,如图所示:


    Reflector可以方便的反编译为ILC#VBDelphi等多种语言,是深入了解IL的最佳利器。

 

    在本文中我们以最简单的ILadsm.exe为说明工具。

3. 分析结构

    分析IL结构,就参阅《第十三回:从Hello, world开始认识IL》 ,已经有了大致的介绍,在此不需要进行过多的笔墨,实际上IL的本身的结构也不是很复杂,了解了大致的体系即可。

4. 解析常用命令

    我们在了解了IL文件结构的基础上,通过学习常用的IL命令,就可以基本上对IL达到了了解不过分的标准,因此对IL常用命令的分析就是本文的重点和要点。我们通过对常用命令的解释、示例与分析,逐步了解你陌生的语言世界原来也很简单。

    IL指令集包括了基础指令集和对象模型指令集大概有近200多个,对我们来说消化这么多的陌生指令显然不是明智的办法,就行高级语言的关键字一样,我们只取其一瓢独饮,抓大放小的革命传统同样是有效的学习办法,详细的指令集解释请下载[MSIL指令速查手册]

4.1 newobjinitobj

    newobjintiobj指令就像两个兄弟,常常让我们迷惑在其然而不知其所以然,虽然认识但是不怎么清楚,这种感觉很郁闷,下面就让我们看看他们的究竟:

代码引入


指令说明


深入分析

从上面的代码中,我们可以得出哪些值得推敲的结论呢?

MSDN给出的解释是:newobj用于分配和初始化对象;而initobj用于初始化值类型。

那么newobj又是如何分配内存,完成对象初始化;而initobj又如何完成对值类型的初始化呢?

显然,关于newobj指令,在《第五回:深入浅出关键字---new说透》中,已经有了一定的介绍,简单说来关于newobj我们有如下结论:

·       从托管堆分配指定类型所需要的全部内存空间。

·       在调用执行构造函数初始化之前,首先初始化对象附加成员:一个是指向该类型方法表的指针;一个是SyncBlockIndex,用于进行线程同步。所有的对象都包含这两个附加成员,用于管理对象。

·       最后才是调用构造函数ctor,进行初始化操作。并返回新建对象的引用地址。

initobj的作用又可以小结为:

·       构造新的值类型,完成值类型初始化。值得关注的是,这种构造不需要调用值类型的构造函数。具体的执行过程呢?以上例来说,initobj MyStruct的执行结果是,将MyStruct中的引用类型初时化为null,而基元类型则置为0

因此,值类型的初始化可以是:

//initobj方式初始化值类型

initobj    Anytao.net.My_Must_net.IL.MyStruct

同时,也可以直接显示调用构造函数来完成初始化,具体为

     MyStruct ms = new MyStruct(123);

    对应于IL则是对构造函数cto的调用。

//调用构造函数方式初始化值类型

call       instance void Anytao.net.My_Must_net.IL.MyStruct::.ctor(int32)

·       Initobj还用于完成设定对指定存储单元的指针置空(null)。这一操作虽不常见,但是应该引起注意。

由此可见,newobjinitobj,都具有完成实例初始化的功能,但是针对的类型不同,执行的过程有异。其区别主要包括:

·       newobj用于分配和初始化对象;而initobj用于初始化值类型。因此,可以说,newobj在堆中分配内存,并完成初始化;而initobj则是对栈上已经分配好的内存,进行初始化即可,因此值类型在编译期已经在栈上分配好了内存。

·       newobj在初始化过程中会调用构造函数;而initobj不会调用构造函数,而是直接对实例置空。

·       newobj有内存分配的过程;而initobj则只完成数据初始化操作。

关于对象的创建,还有其他的情况值得注意,例如:

·       Newarr指令用来创建一维从零起始的数组;而多维或非从零起始的一维数组,则仍由newobj指令创建。

·       String类型的创建由ldstr指令来完成,具体的讨论我们在下文来展开。

4.2 callcallvirtcalli

callcallvirtcalli指令用于完成方法调用,这些正是我们在IL中再熟悉不过的几个朋友。那么,同样是作为方法调用,这几位又有何区别呢?我们首先对其做以概括性的描述,再来通过代码与实例,进入深入分析层面。

·       call使用静态调度,也就是根据引用类型的静态类型来调度方法。

·       callvirt使用虚拟调度,也就是根据引用类型的动态类型来调度方法;

·       calli又称间接调用,是通过函数指针来执行方法调用;对应的直接调用当然就是前面的:callcallvirt

然而,虽然有以上的通用性结论,但是对于callcallvirt不可一概而论。call在某种情况下可以调用虚方法,而callvirt也可以调用非虚方法。具体的分析我们在以后的文章中来展开,暂不做过多分析。   

5. 结论

    本文从几个重点的IL指令开始,力求通过对比性的分析和深入来逐步揭开IL的神秘与迷惑,正如我们在开始强调的那样,本文只是个开始也许也是个阶段,对IL的探求正如我自己的脚步一样,也在继续着,为的是在.NET的技术世界能够有更多的领悟。作者期望通过不断的努力逐渐和大家一起从IL世界探求.NET世界,在以后的讨论中我们间或的继续这个主题的不断成长。



[
下载]

reflector.exe

IL指令速查手册(感谢温少提供)

参考文献

USAJeffrey Richter, Applied Microsoft .NET Framework Programming

USADavid Chappell Understanding .NET

[公告]

CLR团队公告】活动公告、邀请函团队纲领

【系列公告】从架构到设计、你必须知道的.NET

温故知新

[开篇有益]
[第一回:恩怨情仇:isas]
[第二回:对抽象编程:接口和抽象类]
[第三回:历史纠葛:特性和属性]
[第四回:后来居上:classstruct]
[第五回:深入浅出关键字---new说透]
[第六回:深入浅出关键字---basethis]
[第七回:品味类型---从通用类型系统开始]
[第八回:品味类型---值类型与引用类型(上)-内存有理]
[第九回:品味类型---值类型与引用类型(中)-规则无边]
[第十回:品味类型---值类型与引用类型(下)-应用征途]
[第十一回:参数之惑---传递的艺术(上)]
[第十二回:参数之惑---传递的艺术(下)]
[第十三回:从Hello, world开始认识IL]

©2007 Anytao.com

原创作品,转贴请注明作者和出处,留此信息。

本贴子以现状提供且没有任何担保,同时也没有授予任何权利。
This posting is provided "AS IS" with no warranties, and confers no rights.

posted @ 2007-08-22 09:21  Anytao  阅读(14749)  评论(23编辑  收藏  举报