Python内部执行过程

 

Python内部执行过程

一、编译过程概述

  当我们执行Python代码的时候,在Python解释器用四个过程“拆解”我们的代码,最终被CPU执行返回给用户。

  首先当用户键入代码交给Python处理的时候会先进行词法分析,例如用户键入关键字或者当输入关键字有误时,都会被词法分析所触发,不正确的代码将不会被执行。

  下一步Python会进行语法分析,例如当"for i in test:"中,test后面的冒号如果被写为其他符号,代码依旧不会被执行。

  下面进入最关键的过程,在执行Python前,Python会生成.pyc文件,这个文件就是字节码,如果我们不小心修改了字节码,Python下次重新编译该程序时会和其上次生成的字节码文件进行比较,如果不匹配则会将被修改过的字节码文件进行覆盖,以确保每次编译后字节码的准确性。

  那么什么是字节码?字节码在Python虚拟机程序里对应的是PyCodeObject对象。.pyc文件是字节码在磁盘上的表现形式。简单来说就是在编译代码的过程中,首先会将代码中的函数、类等对象分类处理,然后生成字节码文件。有了字节码文件,CPU可以直接识别字节码文件进行处理,接着Python就可执行了。

二、过程图解

三、编译字节码

  Python中有一个内置函数compile(),可以将源文件编译成codeobject,首先看这个函数的说明:

  compile(...) compile(source, filename, mode[, flags[, dont_inherit]]) -> code object

  参数1:源文件的内容字符串

  参数2:源文件名称

  参数3:exec-编译module,single-编译一个声明,eval-编译一个表达式 一般使用前三个参数就够了

  使用示例:

#src_file.py

#some function

def f(d=0):

    c=1

    print "hello"

a=9

b=8

f()

 

>>> a=open('src_file.py','r').read()    #命令行模式中打开源文件进行编译

>>> co=compile(a,'src_file','exec')

>>> type(co)

<type 'code'>    #编译出了codeobject对象

 

四、codeobject对象的属性

  codeobject有哪些变量,接上节的内容分析一下:

>>> print co.co_names    #所有的符号名称

('f', 'a', 'b')

 

>>> print co.co_name    #模块名、函数名、类名

<module>

 

>>> print co.co_consts    #常量集合、函数f和两个int常量a,b,d

(0, <code object f at 0xb7273b18, file "src_file", line 2>, 9, 8, None)

 

>>> print co.co_consts[1].co_varnames    #可以看到f函数也是一个codeobject,打印f中的局部变量

('c',)

 

>>> print co.co_code    #字节码指令

dZdZdZedS

 

>>> print co.co_consts[1].co_firstlineno    #代码块在文件中的起始行号

2

 

>>> print co.co_stacksize    #代码栈大小

2

 

>>> print co.co_filename    #文件名

src_file    #模块名、函数名、类名

 

  codeobject的co_code代表了字节码,这个字节码有什么含义?我们可以使用dis模块进行python的反编译:

import dis

dis.dis(co)

>>> output

 2        0 LOAD_CONST               0 (0)

          3 LOAD_CONST               1 (<code object f at 0xb7273b18, file "src_file", line 2>)

          6 MAKE_FUNCTION            1

          9 STORE_NAME               0 (f)

 5        12 LOAD_CONST              2 (9)

          15 STORE_NAME              1 (a)

 
 6        18 LOAD_CONST              3 (8)

          21 STORE_NAME              2 (b)

 
 7        24 LOAD_NAME               0 (f)

          27 CALL_FUNCTION           0

          30 POP_TOP            

          31 LOAD_CONST              4 (None)

          34 RETURN_VALUE

 

  从反编译的结果来看,python字节码其实是模仿的x86的汇编,将代码编译成一条一条的指令交给一个虚拟的cpu去执行。

  • 第一列:行号
  • 第二列:指令在代码块中的偏移量
  • 第三列:指令
  • 第四列:操作数
  • 第五列:操作数说明

 

 

https://blog.csdn.net/helloxiaozhe/article/details/78104975

 

posted @ 2019-12-12 14:47  追赶菜鸟  阅读(410)  评论(0编辑  收藏  举报