Day21 of learning python--模块和包，及异常处理

1.模块

模块的定义：一个模块就是一个包含了python定义和声明的文件，文件名就是模块名字加上.py的后缀。

为何使用模块：通常将程序写到文件中以便永久保存下来，将程序分成一个个的文件，这样做程序的结构更清晰，方便管理。

注意：模块可以包含可执行的语句和函数的定义，这些语句的目的是初始化模块，它们只在模块名第一次遇到导入import语句时才执行（import语句是可以在程序中的任意位置使用的，且针对同一个模块import多次，为了防止你重复导入，Pythond的优化手段是：第一次导入后就将模块名加到内存了（sys.moudles记录了所有被导入的模块），后续的import语句仅是对已经加载内存中的模块对象增加了一次引用，不会重新执行模块内的语句）

#my_module.py
print('from the my_module.py')

模块demo

import my_module#只在第一次导入时才执行my_module.py内代码,此处的显式效果是只打印一次'from the my_module.py',当然其他的顶级代码也都被执行了,只不过没有显示效果.
import my_module
import my_module
import my_module
结果是：
from the my_module.py

导入模块

sys.modules是一个字典，内部包含模块名与模块对象的映射，该字典决定了导入模块时是否需要重新导入。

1）每个模块都是一个独立的名称空间，定义在这个模块中的函数，把这个模块的名称空间当做全局名称空间，这样我们在编写自己的模块时，就不用担心我们定义在自己模块中全局变量会在被导入时，与使用者的全局变量冲突。

测试：money与my_module.money不冲突
#my_module
print('from the my_module.py')
def change():
    global momey  #虽然此处定义的是全局的变量，但是仅是对于模块而言的
    momey = 1000
    print(momey)
#my_demo
import my_module
momey = 10
my_module.change()
print(momey)
结果：
from the my_module.py
10

2）首次导入模块my_module时做的三件事

1.为源文件（my_module模块）创建新的名称空间，在my_module中定义的函数和方法若是使用了global时访问的就是这个名称空间

2.在新创建的命名空间中执行模块中包含的代码。事实上函数定义也是‘被执行’的语句，模块级别函数定义的执行将函数名放入模块全局名称空间表，用globals()可以查看

3.创建名字my_module来引用该命名空间，这个名字和变量名没什么区别，都是‘第一类的’，且使用my_module.名字的方式可以访问my_module.py文件中定义的名字

3）为模块起别名，作用是具不同的模块内有相同的方法名，或者对象。

# mysql.py
def sqlparse():
    print('from mysql sqlparse')
# oracle.py
def sqlparse():
    print('from oracle sqlparse')

#test.py
db_type = input('>>>')
if db_type == 'mysql':
    import mysql as db
elif db_type == 'oracle':
    import oracle as db

db.sqlparse()

有两个模块mysql和oracle，根据用户的输入，选择不同的sql功能

4）from....import....

对比import my_module，会将源文件的名称空间'my_module'带到当前名称空间中，使用时必须是my_module.名字的方式。而from...import......，也会创建新的名称空间，但是将my_module中的名字直接导入到当前的名称空间中，在当前名称空间中，直接使用名字就可以了。

#my_module.py
print('from the my_module.py')
def change():
    global momey
    momey = 1000
    print(momey)
def read():
    print('this is readable')
print('the last one')
#demo.py
from my_module import change,read # 能够连续导入多个函数
change()
read()
结果为：
from the my_module.py #导入函数时，仍要执行模块
the last one
1000
this is readable

View Code

#demo.py
from my_module import read1
def read1():
    print('==========')
read1()
'''
执行结果:
from the my_module.py
==========
'''

导入的函数read1，被当前位置定义的read1覆盖掉了

需要特别强调的一点是：python中的变量赋值不是一种存储操作，而只是一种绑定关系

from my_module import money,read1
money=100 #将当前位置的名字money绑定到了100
print(money) #打印当前的名字
read1() #读取my_module.py中的名字money,仍然为1000

'''
from the my_module.py
100
my_module->read1->money 1000
'''

支持as重命名

 from my_module import read1 as read

支持导入多行

from my_module import (read1,
                  read2,
                  money)

from my_module import * 把my_module中所有的不是以下划线开头的名字都导入当前的名称空间，大部分情况下我们的python程序不应该使用这种导入方式，因为*你不知道你导入什么名字，很有可能会覆盖掉你之前已经定义的名字。而且可读性极其的差，在交互式环境中导入时有问题。

通常这种模式经常和__all__=[ , ] 这个内容是添加在模块中，这样在另外一个文件中用from my_module import *就这能导入列表中规定的名字

5）模块的加载与修改

每个模块只被导入一次,放入字典sys.modules中，如果你改变了模块的内容，你必须重启程序，python不支持重新加载或卸载之前导入的模块，在pycharm中就是重新启动Run：

6）把模块当做脚本执行

我们可以通过模块的全局变量__name__来查看模块名：

当做脚本运行：
__name__ 等于'__main__'

当做模块导入：
__name__= 模块名

作用：用来控制.py文件在不同的应用场景下执行不同的逻辑
if __name__ == '__main__':

7）模块搜索路径

在第一次导入某个模块时（比如my_module），会先检查该模块是否已经被加载到内存中（当前执行文件的名称空间对应的内存），如果有则直接引用。如果没有，解释器则会查找同名的内建模块，如果还没有找到就从sys.path给出的目录列表中依次寻找my_module.py文件。

所以模块的查找顺序是：内存中已经加载的模块->内置模块->sys.path路径中包含的模块

python程序可以修改sys.path，路径放在前面的优先加载

import sys
print(sys.path)
sys.path.append('a/b/c')
sys.path.insert(0,'x/y/z')
print(sys.path)

8）编译文件

为了提高加载模块的速度，强调：提高的是加载速度而绝非运行速度。python解释器会在__pycache__目录中下缓存每个模块编译后的版本，格式为：module.version.pyc。通常会包含python的版本号。例如，在CPython3.3版本下，my_module.py模块会被缓存成__pycache__/my_module.cpython-33.pyc。这种命名规范保证了编译后的结果多版本共存。在速度上从.pyc文件中读指令来执行不会比从.py文件中读指令执行更快，只有在模块被加载时，.pyc文件才是更快的。Python检查源文件的修改时间与编译的版本进行对比，如果过期就需要重新编译，这是完全自动的过程。

9）dir()函数

内建函数dir是用来查找模块中定义的名字，返回一个有序字符串列表

import my_module
dir(my_module)
结果：
['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'change', 'read']

如果没有参数,dir()列举出当前定义的名字

dir()不会列举出内建函数或名字，它们都被定义到了标准模块builtin中，可以列举出它们，

import builtins
dir(builtins)

2.包

包是一种通过使用‘.模块名’来组织python模块名称空间的方式。

（1）无论是import形式还是from...import...形式，凡是在导入语句中（而不是在使用时）遇到带点的，都要第一时间注意，这是关于包才有的导入语

（2）包是目录级的（文件夹级），文件夹是用来组成py文件（包的本质就是一个包含__init__.py文件的目录）

（3）import导入文件时，产生名称空间中的名字来源于文件，import 包，产生的名称空间的名字同样来源于文件，即包下的__init__.py，导入包本质就是在导入该文件

强调：

　　1. 在python3中，即使包下没有__init__.py文件，import 包仍然不会报错，而在python2中，包下一定要有该文件，否则import 包报错

　　2. 创建包的目的不是为了运行，而是被导入使用，记住，包只是模块的一种形式而已，包即模块

包A和包B下有同名模块也不会冲突，如A.a与B.a来自俩个命名空间

import os
os.makedirs('glance/api')
os.makedirs('glance/cmd')
os.makedirs('glance/db')
l = []
l.append(open('glance/__init__.py','w'))
l.append(open('glance/api/__init__.py','w'))
l.append(open('glance/api/policy.py','w'))
l.append(open('glance/api/versions.py','w'))
l.append(open('glance/cmd/__init__.py','w'))
l.append(open('glance/cmd/manage.py','w'))
l.append(open('glance/db/models.py','w'))
map(lambda f:f.close() ,l)

创建目录代码

glance/                   #Top-level package

├── __init__.py      #Initialize the glance package

├── api                  #Subpackage for api

│   ├── __init__.py

│   ├── policy.py

│   └── versions.py

├── cmd                #Subpackage for cmd

│   ├── __init__.py

│   └── manage.py

└── db                  #Subpackage for db

    ├── __init__.py

    └── models.py

目录结构

#文件内容

#policy.py
def get():
    print('from policy.py')

#versions.py
def create_resource(conf):
    print('from version.py: ',conf)

#manage.py
def main():
    print('from manage.py')

#models.py
def register_models(engine):
    print('from models.py: ',engine)

文件内容

使用包的注意事项：

（1）关于包相关的导入语句也分为import和from ... import ...两种，但是无论哪种，无论在什么位置，在导入时都必须遵循一个原则：凡是在导入时带点的，点的左边都必须是一个包，否则非法。可以带有一连串的点，如item.subitem.subsubitem,但都必须遵循这个原则。

（2）对于导入后，在使用时就没有这种限制了，点的左边可以是包,模块，函数，类(它们都可以用点的方式调用自己的属性。

init.py文件

不管是哪种方式，只要是第一次导入包或者是包的任何其他部分，都会依次执行包下的__init__.py文件(我们可以在每个包的文件内都打印一行内容来验证一下)，这个文件可以为空，但是也可以存放一些初始化包的代码。

from glance.api import *

此处是想从包api中导入所有，实际上该语句只会导入包api下__init__.py文件中定义的名字，我们可以在这个文件中定义__all___:

#在__init__.py中定义
x=10

def func():
    print('from api.__init.py')

__all__=['x','func','policy']

glance/                   

├── __init__.py      

├── api                  

│   ├── __init__.py   __all__ = ['policy','versions'] 

│   ├── policy.py

│   └── versions.py

├── cmd               __all__ = ['manage']    

│   ├── __init__.py

│   └── manage.py    

└── db                __all__ = ['models']              

    ├── __init__.py

    └── models.py



from glance.api import *
policy.get()

from glance.api import *

绝对导入和相对导入

我们的最顶级包glance是写给别人用的，然后在glance包内部也会有彼此之间互相导入的需求，这时候就有绝对导入和相对导入两种方式：

绝对导入：以glance作为起始

相对导入：用.或者..的方式最为起始（只能在一个包中使用，不能用于不同目录内）

例如：我们在glance/api/version.py中想要导入glance/cmd/manage.py

在glance/api/version.py

#绝对导入
from glance.cmd import manage
manage.main()

#相对导入
from ..cmd import manage
manage.main()

测试结果：注意一定要在于glance同级的文件中测试。.是指在当前目录，..是指在上一级目录

单独导入包

单独导入包名称时不会导入包中所有包含的所有子模块

#在与glance同级的test.py中
import glance
glance.cmd.manage.main()

'''
执行结果：
AttributeError: module 'glance' has no attribute 'cmd'

'''

解决办法：

1 #glance/__init__.py
2 from . import cmd
3 
4 #glance/cmd/__init__.py
5 from . import manage

执行：

1 #在于glance同级的test.py中
2 import glance
3 glance.cmd.manage.main()

import glance之后直接调用模块中的方法

千万别问：__all__不能解决吗，__all__是用于控制from...import *

glance/                   

├── __init__.py     from .api import *
                    from .cmd import *
                    from .db import *    
├── api                  

│   ├── __init__.py   __all__ = ['policy','versions'] 

│   ├── policy.py

│   └── versions.py

├── cmd               __all__ = ['manage']    

│   ├── __init__.py

│   └── manage.py    

└── db                __all__ = ['models']              

    ├── __init__.py

    └── models.py


import glance
policy.get()

import glance

improt .xxx import * 与all搭配使用

软件开发规范

试用代码

3.异常处理

程序一旦发生错误，就从错误的位置停下来，不再继续执行后面的内容
使用try和except就能处理异常
try是我们需要处理的代码
except 后面跟一个错误类型，当代码发生错误且错误类型符合，就执行后面的代码
except 支持多分支
有没有一个能处理所有错误的类型：Exception
有了万能的处理机制仍然需要把能预测到的问题单独处理
单独处理的所有内容都应该写在万能异常之前
else：没有异常的时候执行else中的代码
finally：不管代码是否异常，都会执行，finally和return相遇的时候，依然会执行，函数里做异常处理，不管是否异常去做收尾工作

异常处理的，是对小段的代码，有逻辑的

try:
    # int('aaa')
    ret = int(input('number>>>'))
    print(ret*'*')
except ValueError:
    print('输入有误，请输入一个数字')
except Exception:
    print('错了老铁')
else:
    print('______________')
finally:
    print('=============')

def func():
    try:
        f = open('file1')
        return True
    except Exception as error:
        print(error)
        return False
    else:
        print('执行了else')
    finally:
        print('执行了finally')
        # f.close()

print(func()
结果：
[Errno 2] No such file or directory: 'file1'
执行了finally
False

posted on 2018-10-23 19:23 smile大豆芽阅读(130) 评论(0) 收藏举报