编译器和解释器

首先，从Python这门语言说起，他有着以下特点

1：面向对象，指程序能够实现，封装，继承，多态

2：动态语言，是在运行时可以改变其结构的语言，例如在程序运行的过程中，给一个类的对象添加原本不存在的属性

3：动态数据类型：变量不需要指定类型，但需要解释器执行代码时去辨别数据类型，这个特点让编程变得简单，但代码执行效率变低

4：高级语言，是指经过高度封装了的编程语言，但对于机器语言，更加适合人类编写和阅读

5：解释型语言，是指无需编译，直接能够将源代码解释为机器语言进行运行的语言

从最后一个特点就可以看出，我们能够看到Python是解释型语言，也就是说，源代码需要通过解释器进行解释执行

那么进而引出本文讨论的主题：

编程语言分为解释型语言和编译型语言，我们需要了解他们的区别，能够更清楚的知道编译器和解释器的区别

C、C++都是编译型语言，编译型语言执行的速度快，缺点是啥呢？

编译型语言需要编译器处理，主要工作流程如下“

源代码（source code）-》预处理器（preprocessor）-》编译器（compiler）-》目标代码（object code）-》链接器（Linker）-》可执行程序（executables）

在这个工作流程中，目标代码要和机器的CPU架构相匹配，库文件要和操作系统相匹配

如果想在不同CPU的机器或者系统上运行C语言的源代码，就需要针对不同的CPU架构和操作系统进行编译，这样才能够在机器上运行程序

所以编译型语言的缺点我们看到了，他不适合跨平台

到这里就应该明白了，为什么CPU一样，但是exe程序只能在Windows中执行，而不能在Mac中运行了，因为针对的不同操作系统，使用的编译器不同，生成的可执行程序不同

有以下例子：

一个多国语言老师教了很多外国学生，这些学生分别来自各个国家，当老师给这些学生发放资料的时候，都需要把中文资料先进行翻译，变成英文版，德文版，法文版和韩文版的电子文档，再分别发给每个国家的学生去学习

这个翻译的工作非常繁琐

不仅，要翻译每个国家的语言，而且，还要考虑英式英语和美式英语的区别分别翻译成不同的英文版

再有就是每次资料更新还都要重新翻译一遍

在上面的例子中，中国老师就像是编译型语言的开发人员，中文资料就是编译型语言的源代码，翻译后的资料就是不同CPU架构的机器语言，不同语言的学生就是不同CPU架构的机器，美国和英国的学生就是CPU架构相同但操作系统不同的机器

请注意：这里涉及到跨平台的概念，平台可以理解为不同CPU架构（例如X86，ARM等）的机器和同种CPU但不同操作系统的机器

继续刚才的例子

这位中国老师在想，为什么要自己去翻译呢？给他们一人一个自动翻译软件不就好了？

于是，老师就给每个学生定制了自动翻译软件，这个软件可以一页一页的将原始中文资料翻译成不同的语言资料给学生看

现在的情况，这名老师的工作瞬间轻松了很多，不需要再考虑制作各种语言版本的资料，只需要把精力放在制作中文资料就好了

早期的解释器就是这样的流程：源代码（source code）-》解释器（interpreter）

源代码无需先编译成可执行程序，在程序执行时，解释器读取一句源代码后，先进行词法分析和语法分析，再将源代码转换为解释器能够执行的中间代码（字节码），最后，由解释器将中间代码解释为可执行的机器指令

所以，编译型语言的可执行程序产生的是直接执行机器指令，而解释型语言的每一句源代码都要经过解释器解释为可以执行的机器指令，相比之下解释型语言的执行效率会低一些，但是，解释型语言在不同的平台有不同的解释器，源代码跨平台的目的实现了，开发人员不用再考虑每个平台如何去编译，只需要关注代码的编写，编写玩的代码在任何平台都能无需修改（或少量修改）就能正确执行

例如，Linux系统中执行Python源代码支持fork函数，而window系统中不支持这个函数，如果将运行在Linux系统中源代码移植到windows系统，这时就需要进行修改。

理解了编译型语言和解释型语言的区别，就可以继续看例子了：

老师虽然给学生定制了翻译软件，但是发信啊这个软件翻译每页内容都很慢，究其原因，这个软件需要把每页内容分析一遍，将内涵复杂的中文（例如成语）转换成简单直接能够进行翻译的中文，再进行向其他国家的语言翻译，看到这个问题后，这些软件的提供商想出了一个解决方案：

这个方案就是，第一次打开资料时，让翻译软件把原始资料完整的进行分析转换，保存成一个能够直接翻译的中间文件，然后，翻译程序再一页一页的读取转换后的中间文件去翻译，这样的话，虽然第一次打开时慢了一些，但是，当学生再次打开资料时，只要原始资料没有更新，就直接通过保存的中间文件进行翻译，速度会大有提升，当然，程序打开时，需要对比一下原始资料是否和中间的文件一致，如果有修改，则再次编译出新的中间文件，覆盖旧的中间文件

Python程序运行时，就像上面的例子一样，先将源代码完整的进行转换，编译成更有效率的字节码，保存成后缀为“。pyc”的字节码文件，然后，翻译器再通过这个文件一句一句的翻译为机器语言去执行

而Shell中执行源代码时不会生成中间文件，每次都是读取源代码，转化为字节码后，解释执行。

上面的例子还没结束

这些软件提供商提出的方案虽然解决了一些效率问题，但是还无法完全让人满意

经过苦思冥想，软件提供商又想出了一个新的方案：

在原始资料中有很多重复内容：

这些重复内容如果翻译一次后，就把它保存，再碰到相同的内容就直接使用保存的翻译结果，而没必要每次都再翻译，长时间运行程序时，速度就会快上很多，这个例子就是JIT（Just-In-Compiler）的比喻，无论是使用解释器进行解释执行，还是使用编译器进行编译后执行，最终源代码都需要被转换为对应平台的本地机器指令，那么一些重复出现的代码，就可以将其编译为本地机器的指令，重复使用，从而提高效率，这些重复出现的代码包括多次调用的方法和多次执行的循环体

JIT即时编译器比较典型的例子就是在JVM（JAVA虚拟机）中。

JAVA程序最初是通过解释器进行解释执行，当JAVA虚拟机发现某个方法或代码进行特别频繁的时候，就会认为这是热点代码（Hot Spot Code），JIT即时编译器会将这些“热点代码”编译成本地机器相关的机器指令，进行各个层次的优化

当程序需要迅速启动和执行的时，解释器可以首先发挥作用，省去编译的时间，立即执行，在程序运行后，随着时间的推移，编译器逐渐发挥作用，把越来越多的代码编译成本地机器指令之后，可以获得更高的执行效率，当程序运行环境中内存资源限制较大，可以使用解释器执行节约内存，反之可以使用编译执行来提升效率

大家都知道，JAVA程序的运行性能很高，基本可以和C和C++的程序相媲美，这主要是因为JIT即时编译器可以针对那些频繁调用的“热点代码”做出深度优化，而静态编译器无法完全推断出哪些是运行时的热点代码，而不能做出针对性的优化，因此，通过JIT即时编译器编译的本地机器指令才会比直接生成的本地机器指令拥有更高的执行效率

转载于知乎南鸢

posted @ 2021-06-11 10:37 专杀小三阅读(398) 评论(0) 收藏举报

刷新页面返回顶部

专杀小三

编译器和解释器

公告