Day21 of learning python--模块和包,及异常处理
1.模块
模块的定义:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀。
为何使用模块:通常将程序写到文件中以便永久保存下来,将程序分成一个个的文件,这样做程序的结构更清晰,方便管理。
注意:模块可以包含可执行的语句和函数的定义,这些语句的目的是初始化模块,它们只在模块名第一次遇到导入import语句时才执行(import语句是可以在程序中的任意位置使用的,且针对同一个模块import多次,为了防止你重复导入,Pythond的优化手段是:第一次导入后就将模块名加到内存了(sys.moudles记录了所有被导入的模块),后续的import语句仅是对已经加载内存中的模块对象增加了一次引用,不会重新执行模块内的语句)
#my_module.py print('from the my_module.py')
import my_module#只在第一次导入时才执行my_module.py内代码,此处的显式效果是只打印一次'from the my_module.py',当然其他的顶级代码也都被执行了,只不过没有显示效果. import my_module import my_module import my_module 结果是: from the my_module.py
sys.modules是一个字典,内部包含模块名与模块对象的映射,该字典决定了导入模块时是否需要重新导入。
1)每个模块都是一个独立的名称空间,定义在这个模块中的函数,把这个模块的名称空间当做全局名称空间,这样我们在编写自己的模块时,就不用担心我们定义在自己模块中全局变量会在被导入时,与使用者的全局变量冲突。
测试:money与my_module.money不冲突 #my_module print('from the my_module.py') def change(): global momey #虽然此处定义的是全局的变量,但是仅是对于模块而言的 momey = 1000 print(momey) #my_demo import my_module momey = 10 my_module.change() print(momey) 结果: from the my_module.py 10
2)首次导入模块my_module时做的三件事
1.为源文件(my_module模块)创建新的名称空间,在my_module中定义的函数和方法若是使用了global时访问的就是这个名称空间
2.在新创建的命名空间中执行模块中包含的代码。事实上函数定义也是‘被执行’的语句,模块级别函数定义的执行将函数名放入模块全局名称空间表,用globals()可以查看
3.创建名字my_module来引用该命名空间,这个名字和变量名没什么区别,都是‘第一类的’,且使用my_module.名字的方式可以访问my_module.py文件中定义的名字
3)为模块起别名,作用是具不同的模块内有相同的方法名,或者对象。
# mysql.py def sqlparse(): print('from mysql sqlparse') # oracle.py def sqlparse(): print('from oracle sqlparse') #test.py db_type = input('>>>') if db_type == 'mysql': import mysql as db elif db_type == 'oracle': import oracle as db db.sqlparse()
4)from....import....
对比import my_module,会将源文件的名称空间'my_module'带到当前名称空间中,使用时必须是my_module.名字的方式。而from...import......,也会创建新的名称空间,但是将my_module中的名字直接导入到当前的名称空间中,在当前名称空间中,直接使用名字就可以了。
#my_module.py print('from the my_module.py') def change(): global momey momey = 1000 print(momey) def read(): print('this is readable') print('the last one') #demo.py from my_module import change,read # 能够连续导入多个函数 change() read() 结果为: from the my_module.py #导入函数时,仍要执行模块 the last one 1000 this is readable
#demo.py from my_module import read1 def read1(): print('==========') read1() ''' 执行结果: from the my_module.py ========== '''
需要特别强调的一点是:python中的变量赋值不是一种存储操作,而只是一种绑定关系
from my_module import money,read1 money=100 #将当前位置的名字money绑定到了100 print(money) #打印当前的名字 read1() #读取my_module.py中的名字money,仍然为1000 ''' from the my_module.py 100 my_module->read1->money 1000 '''
支持as重命名
from my_module import read1 as read
支持导入多行
from my_module import (read1, read2, money)
from my_module import * 把my_module中所有的不是以下划线开头的名字都导入当前的名称空间,大部分情况下我们的python程序不应该使用这种导入方式,因为*你不知道你导入什么名字,很有可能会覆盖掉你之前已经定义的名字。而且可读性极其的差,在交互式环境中导入时有问题。
通常这种模式经常和__all__=[ , ] 这个内容是添加在模块中,这样在另外一个文件中用from my_module import *就这能导入列表中规定的名字
5)模块的加载与修改
每个模块只被导入一次,放入字典sys.modules中,如果你改变了模块的内容,你必须重启程序,python不支持重新加载或卸载之前导入的模块,在pycharm中就是重新启动Run:
6)把模块当做脚本执行
我们可以通过模块的全局变量__name__来查看模块名:
当做脚本运行:
__name__ 等于'__main__'
当做模块导入:
__name__= 模块名
作用:用来控制.py文件在不同的应用场景下执行不同的逻辑
if __name__ == '__main__':
7)模块搜索路径
在第一次导入某个模块时(比如my_module),会先检查该模块是否已经被加载到内存中(当前执行文件的名称空间对应的内存),如果有则直接引用。如果没有,解释器则会查找同名的内建模块,如果还没有找到就从sys.path给出的目录列表中依次寻找my_module.py文件。
所以模块的查找顺序是:内存中已经加载的模块->内置模块->sys.path路径中包含的模块
python程序可以修改sys.path,路径放在前面的优先加载
import sys print(sys.path) sys.path.append('a/b/c') sys.path.insert(0,'x/y/z') print(sys.path)
8)编译文件
为了提高加载模块的速度,强调:提高的是加载速度而绝非运行速度。python解释器会在__pycache__目录中下缓存每个模块编译后的版本,格式为:module.version.pyc。通常会包含python的版本号。例如,在CPython3.3版本下,my_module.py模块会被缓存成__pycache__/my_module.cpython-33.pyc。这种命名规范保证了编译后的结果多版本共存。在速度上从.pyc文件中读指令来执行不会比从.py文件中读指令执行更快,只有在模块被加载时,.pyc文件才是更快的。Python检查源文件的修改时间与编译的版本进行对比,如果过期就需要重新编译,这是完全自动的过程。
9)dir()函数
内建函数dir是用来查找模块中定义的名字,返回一个有序字符串列表
import my_module dir(my_module) 结果: ['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'change', 'read']
如果没有参数,dir()列举出当前定义的名字
dir()不会列举出内建函数或名字,它们都被定义到了标准模块builtin中,可以列举出它们,
import builtins dir(builtins)
2.包
包是一种通过使用‘.模块名’来组织python模块名称空间的方式。
(1)无论是import形式还是from...import...形式,凡是在导入语句中(而不是在使用时)遇到带点的,都要第一时间注意,这是关于包才有的导入语
(2)包是目录级的(文件夹级),文件夹是用来组成py文件(包的本质就是一个包含__init__.py文件的目录)
(3)import导入文件时,产生名称空间中的名字来源于文件,import 包,产生的名称空间的名字同样来源于文件,即包下的__init__.py,导入包本质就是在导入该文件
强调:
1. 在python3中,即使包下没有__init__.py文件,import 包仍然不会报错,而在python2中,包下一定要有该文件,否则import 包报错
2. 创建包的目的不是为了运行,而是被导入使用,记住,包只是模块的一种形式而已,包即模块
包A和包B下有同名模块也不会冲突,如A.a与B.a来自俩个命名空间
import os os.makedirs('glance/api') os.makedirs('glance/cmd') os.makedirs('glance/db') l = [] l.append(open('glance/__init__.py','w')) l.append(open('glance/api/__init__.py','w')) l.append(open('glance/api/policy.py','w')) l.append(open('glance/api/versions.py','w')) l.append(open('glance/cmd/__init__.py','w')) l.append(open('glance/cmd/manage.py','w')) l.append(open('glance/db/models.py','w')) map(lambda f:f.close() ,l)
glance/ #Top-level package ├── __init__.py #Initialize the glance package ├── api #Subpackage for api │ ├── __init__.py │ ├── policy.py │ └── versions.py ├── cmd #Subpackage for cmd │ ├── __init__.py │ └── manage.py └── db #Subpackage for db ├── __init__.py └── models.py
#文件内容 #policy.py def get(): print('from policy.py') #versions.py def create_resource(conf): print('from version.py: ',conf) #manage.py def main(): print('from manage.py') #models.py def register_models(engine): print('from models.py: ',engine)
使用包的注意事项:
(1)关于包相关的导入语句也分为import和from ... import ...两种,但是无论哪种,无论在什么位置,在导入时都必须遵循一个原则:凡是在导入时带点的,点的左边都必须是一个包,否则非法。可以带有一连串的点,如item.subitem.subsubitem,但都必须遵循这个原则。
(2)对于导入后,在使用时就没有这种限制了,点的左边可以是包,模块,函数,类(它们都可以用点的方式调用自己的属性。
__init__.py文件
不管是哪种方式,只要是第一次导入包或者是包的任何其他部分,都会依次执行包下的__init__.py文件(我们可以在每个包的文件内都打印一行内容来验证一下),这个文件可以为空,但是也可以存放一些初始化包的代码。
from glance.api import *
此处是想从包api中导入所有,实际上该语句只会导入包api下__init__.py文件中定义的名字,我们可以在这个文件中定义__all___:
#在__init__.py中定义 x=10 def func(): print('from api.__init.py') __all__=['x','func','policy']
glance/ ├── __init__.py ├── api │ ├── __init__.py __all__ = ['policy','versions'] │ ├── policy.py │ └── versions.py ├── cmd __all__ = ['manage'] │ ├── __init__.py │ └── manage.py └── db __all__ = ['models'] ├── __init__.py └── models.py from glance.api import * policy.get()
绝对导入和相对导入
我们的最顶级包glance是写给别人用的,然后在glance包内部也会有彼此之间互相导入的需求,这时候就有绝对导入和相对导入两种方式:
绝对导入:以glance作为起始
相对导入:用.或者..的方式最为起始(只能在一个包中使用,不能用于不同目录内)
例如:我们在glance/api/version.py中想要导入glance/cmd/manage.py
在glance/api/version.py #绝对导入 from glance.cmd import manage manage.main() #相对导入 from ..cmd import manage manage.main()
测试结果:注意一定要在于glance同级的文件中测试。.是指在当前目录,..是指在上一级目录
单独导入包
单独导入包名称时不会导入包中所有包含的所有子模块
#在与glance同级的test.py中 import glance glance.cmd.manage.main() ''' 执行结果: AttributeError: module 'glance' has no attribute 'cmd' '''
解决办法:
1 #glance/__init__.py 2 from . import cmd 3 4 #glance/cmd/__init__.py 5 from . import manage
执行:
1 #在于glance同级的test.py中 2 import glance 3 glance.cmd.manage.main()
import glance之后直接调用模块中的方法
千万别问:__all__不能解决吗,__all__是用于控制from...import *
glance/ ├── __init__.py from .api import * from .cmd import * from .db import * ├── api │ ├── __init__.py __all__ = ['policy','versions'] │ ├── policy.py │ └── versions.py ├── cmd __all__ = ['manage'] │ ├── __init__.py │ └── manage.py └── db __all__ = ['models'] ├── __init__.py └── models.py import glance policy.get() import glance
软件开发规范

试用代码
3.异常处理
程序一旦发生错误,就从错误的位置停下来,不再继续执行后面的内容
使用try和except就能处理异常
try是我们需要处理的代码
except 后面跟一个错误类型,当代码发生错误且错误类型符合,就执行后面的代码
except 支持多分支
有没有一个能处理所有错误的类型:Exception
有了万能的处理机制仍然需要把能预测到的问题单独处理
单独处理的所有内容都应该写在万能异常之前
else:没有异常的时候执行else中的代码
finally:不管代码是否异常,都会执行,finally和return相遇的时候,依然会执行,函数里做异常处理,不管是否异常去做收尾工作
异常处理的,是对小段的代码,有逻辑的
try: # int('aaa') ret = int(input('number>>>')) print(ret*'*') except ValueError: print('输入有误,请输入一个数字') except Exception: print('错了老铁') else: print('______________') finally: print('=============')
def func(): try: f = open('file1') return True except Exception as error: print(error) return False else: print('执行了else') finally: print('执行了finally') # f.close() print(func() 结果: [Errno 2] No such file or directory: 'file1' 执行了finally False
浙公网安备 33010602011771号