天天看点

跟小静读CLR via C#(01)-.NET平台下代码是怎么跑起来的

想起前些日子去某知名电子商务公司面试的时候,问了很多我.NET程序的运行机制,当时很多比较底层的问题都没答好,发现自己的知识太皮毛了。于是决定好好学习。今天看的是代码在.NET平台体系下的执行过程,它是怎么跑起来的?

程序在.NET框架下运行,首先要将源代码编译为托管模块。CLR是一个可以被多种语言所使用的运行时,它的很多特性可以用于所有面向它的开发语言。微软开发了多种语言的编译器,编译时会使用相应的编译器进行语法检查器和代码分析器,在编译完成后都生成一个托管模块。

<a href="http://images.cnblogs.com/cnblogs_com/janes/201107/201107011603364358.png"></a>

托管模块?

托管模块是一个需要CLR环境才能执行的标准windows PE文件,包含IL和元数据以及PE表头和CLR表头。

IL又叫托管代码,是编译器编译源文件后产生的指令,CLR会在运行时将IL编译成本地CPU指令。

元数据实际上是一个数据表集合,用来描述托管模块中所定义和引用的内容。VS能够智能感知就得益于元数据的描述。

PE表头:标准Windows PE文件表头,包含文件类型(如GUI、CUI等),以及文件创建时间等信息。

CLR表头:包含标识托管模块的一些信息。如CLR版本号,托管模块入口点方法(main方法)以及MethodDef元数据等等。

一般编译器会默认将生成的托管模块生成一个程序集,CLR直接打交道的是程序集(assembly),程序集包含一个或多个托管模块,以及资源文件的逻辑组合。组合过程如下:

<a href="http://images.cnblogs.com/cnblogs_com/janes/201107/201107011603376376.png"></a>

左侧为一些托管模块,在经过一些工具的处理后,生成了一个PE文件,也就是程序集。程序集中有一个清单(manifest)数据块,用来描述组成程序集的所有文件。此外,程序集还包含它所引用的程序集的信息,这就使得程序集可以实现自描述。这样CLR就直接知道了程序集所需要的所有内容,因此程序集的部署比非托管组件要容易。

还可以通过工具CLRVer.exe查看机器上装的所有CLR版本。

<a href="http://images.cnblogs.com/cnblogs_com/janes/201107/201107081050389684.png"></a>

加载并初始化CLR的过程:

<a href="http://images.cnblogs.com/cnblogs_com/janes/201107/201107011603388111.png"></a>

IL代码要通过即时编译器(JIT)转换成本地CPU指令。

方法第一次调用过程?

1. 当程序第一次运行时,会调用JITCompiler函数,它可以知道调用了那些方法,以及定义该方法的类。

2. 然后JITCompiler函数在元数据中搜索该IL代码的位置,验证后转换成本地CPU指令。将指令保存在动态分配的内存中

3. JITCompiler将被调用方法地址改为第2步的内存地址

4. 跳转到上述代码块上执行代码

5. 执行完成后返回

IL是基于堆栈的语言,而且是无类型的。IL的好处之一是提高程序的健壮性,在将IL代码转换成本地CPU指令时,CLR将执行安全验证的过程,验证失败则会抛出异常。

举个小例子,我们可以看出来有时候能通过编译器的检验,但是运行时还是会抛出异常。

<a href="http://images.cnblogs.com/cnblogs_com/janes/201107/201107221739249416.png"></a>

再次调用该方法?

在一个程序中,我们经常反复调用同一个方法,当再次调用该方法时就不需要重复进行验证了,可以直接调用内存块中已有的本地代码,完全跳过JITCompile函数的验证和编译过程。所以同一方法只有在第一次调用时会产生一些性能损失,后续调用就可以全速进行了。

关闭程序?

由于编译器将本地代码保存在动态内存中,所以关闭程序时本地代码将发生丢失。当再次启动程序或者同时运行程序的两个实例时,JIT编译器将再次将IL代码编译为本地指令。

    本文转自 陈敬(Cathy) 博客园博客,原文链接:http://www.cnblogs.com/janes/archive/2011/07/01/2095587.html,如需转载请自行联系原作者