第四篇:模块与包
一、模块介绍
1、什么是模块?
在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。 使用模块有什么好处? 1、最大的好处是大大提高了代码的可维护性。 2、其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。我们在编写程序的时候,也经常引用其他模块。 最后总结: 模块就是一组功能的集合体,我们的程序可以导入模块来复用模块里的功能。
模块一共三种:
- python标准库
- 第三方模块
- 应用程序自定义模块
二、模块导入的方法
1、import导入
1 import module1[, module2[,... moduleN]
当我们使用import语句的时候,Python解释器是怎么找到对应的文件的呢?
答:Python解释器有自己的搜索路径,存在sys.path里。
import sys print(sys.path) #如有问题,在控制台运行,因为Pycharm会自动添加一下路径
2、from...import语句
1 from module import fuction1[, fuction2[, ... fuctionN]]
这个声明不会把这个module模块导入到当前命名空间中,只会将它里面的fuction1或fuction2单个引入到执行这个声明的模块的全局符号表。
3、from ...import *
1 from module import *
这个提供了一个简单的方法来导入一个模块中的所有项目 。然而这种声明不该被过多地使用。大多数情况下,Python程序员不适用这种方法,因为引入的其它来源的命名,可能会覆盖已有的定义。
4、运行本质
1 #1 import test 2 #2 from test import add
无论是1还是2,首先通过sys.path找到test.py,然后执行test脚本(全部执行)。
区别:1会将test这个变量名加载到命名空间
2只会将add这个变量名加载进来
三、包
1、什么是包?
如果不同的人编写的模块名相同怎么办?为了避免模块名冲突,Python又引入了按目录来组织模块的方法,称为包(Package)。
举个例子,一个abc.py的文件就是一个名字叫abc的模块,一个xyz.py的文件就是一个名字叫xyz的模块。
现在,假设我们的abc和xyz这两个模块名字与其他模块冲突了,于是我们可以通过包来组织模块,避免冲突。
注意:每一个包目录下面都会有一个__init__.py的文件,这个文件是必须存在的,否则,Python就把这个目录当成普通目录(文件夹),而不是一个包。__init__.py可以是空文件,也可以有Python代码,因为__init__.py本身就是一个模块,而它的模块名就是对应包的名字。
调用包就是执行包下的__init__.py文件

1 ---------------
在nod1里Import hello是找不到的,有的人说能找得到,那是因为pycharm为你把myapp这一层路径加入到了sys.path里面,所以可以找到,但是,如果成行在命令行运行,则报错,那怎么办呢?手动将myapp这一层路径加入到sys.path中去:
1 import sys,os 2 BASE_DIR=os.path.dirname(os.path.dirname(os.path.abspath(__file__))) 3 sys.path.append(BASE_DIR) 4 import hello 5 hello.hello1()
2 ---------------
if __name__=='__main__': print('ok')
“Make a .py both importable and executable”
如果我们是直接执行某个.py文件的时候,该文件中那么”__name__ == '__main__'“是True,但是我们如果从另外一个.py文件通过import导入该文件的时候,这时__name__的值就是我们这个py文件的名字而不是__main__。
这个功能还有一个用处:调试代码的时候,在”if __name__ == '__main__'“中加入一些我们的调试代码,我们可以让外部模块调用的时候不执行我们的调试代码,但是如果我们想排查问题的时候,直接执行该模块文件,调试代码能够正常运行!

1 ##-------------cal.py 2 def add(x,y): 3 4 return x+y 5 ##-------------main.py 6 import cal #from module import cal 7 8 def main(): 9 10 cal.add(1,2) 11 12 ##--------------bin.py 13 from module import main 14 15 main.main()
# from module import cal 改成 from . import cal同样可以,这是因为bin.py是我们的执行脚本, # sys.path里有bin.py的当前环境。即/Users/yuanhao/Desktop/whaterver/project/web这层路径, # 无论import what , 解释器都会按这个路径找。所以当执行到main.py时,import cal会找不到,因为 # sys.path里没有/Users/yuanhao/Desktop/whaterver/project/web/module这个路径,而 # from module/. import cal 时,解释器就可以找到了。
四、time模块
1、时间的表示方式
- 时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。运行“type(time.time())”,返回的是float类型。
- 格式化的时间字符串
- 元组(struct_time):struct_time元组共有9个元素(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)
1 import time 2 # 1 time():返回当前时间的时间戳 3 # print(time.time()) 1567421852.7636826 4 5 #----------------------------------------- 6 7 # 2 localtime([secs]) : 8 # 将一个时间戳转化为当前时区的struct_time。secs参数未提供,则以当前时间为准 9 print(time.localtime()) 10 #time.struct_time(tm_year=2019, tm_mon=9, tm_mday=2, tm_hour=19, 11 # tm_min=0, tm_sec=41, tm_wday=0, tm_yday=245, tm_isdst=0) 12 print(time.localtime(1567421852.7636826)) 13 14 #------------------------------------------- 15 16 # 3 gmtime([secs])和localtime()方法类似,gmtime()方法是将一个时间戳转换为UTC时区(0时区)的struct_time。 17 print(time.gmtime()) 18 19 #-------------------------------------------- 20 21 # 4 mktime(t):将一个struct_time转换为时间戳 22 print(time.mktime(time.localtime())) 23 24 #--------------------------------------------- 25 26 # 5 asctime([t]):把一个表示时间的元组或者struct_time表示为这种形式:'Sun Jun 20 23:25:03 1996'。 27 #如果没有参数会把time.localtime()作为参数传入 28 print(time.asctime()) 29 print(time.asctime(time.localtime())) #Mon Sep 2 19:11:24 2019 30 31 #---------------------------------------------- 32 33 # 6 ctime([secs]):把一个时间戳(按秒计算的浮点数)转换为time.asctime()的形式。如果参数未给或者为 34 #None的时候,将会默认time.time()为参数。它的作用相当于time.asctime(time.localtime(secs))。 35 print(time.ctime()) # Mon Sep 2 19:18:40 2019 36 print(time.ctime(time.time())) # Mon Sep 2 19:18:40 2019 37 38 #---------------------------------------------- 39 40 # 7 strftime(format[, t]) : 把一个代表时间的元组或者struct_time(如由time.localtime()和 41 # time.gmtime()返回)转化为格式化的时间字符串。如果t未指定,将传入time.localtime()。如果元组中任何一个 42 # 元素越界,ValueError的错误将会被抛出。 43 print(time.strftime("%Y-%m-%d %X", time.localtime())) # 2016-09-11 00:49:56 44 45 #---------------------------------------------- 46 47 # 8 time.strptime(string[, format]) 48 # 把一个格式化时间字符串转化为struct_time。实际上它和strftime()是逆操作。 49 print(time.strptime('2011-05-05 16:37:06', '%Y-%m-%d %X')) 50 51 # time.struct_time(tm_year=2011, tm_mon=5, tm_mday=5, tm_hour=16, tm_min=37, tm_sec=6, 52 # tm_wday=3, tm_yday=125, tm_isdst=-1) 53 54 # 在这个函数中,format默认为:"%a %b %d %H:%M:%S %Y"。 55 56 57 # 9 sleep(secs) 58 # 线程推迟指定的时间运行,单位为秒。 59 60 # 10 clock() 61 # 这个需要注意,在不同的系统上含义不同。在UNIX系统上,它返回的是“进程时间”,它是用秒表示的浮点数(时间戳)。 62 # 而在WINDOWS中,第一次调用,返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行 63 # 时间,即两次时间差。


1 help(time) 2 help(time.asctime)
五、random模块
1 import random 2 3 print(random.random())#(0,1)----float 4 5 print(random.randint(1,3)) #[1,3] 6 7 print(random.randrange(1,3)) #[1,3) 8 9 print(random.choice([1,'23',[4,5]]))#23 10 11 print(random.sample([1,'23',[4,5]],2))#[[4, 5], '23'] 12 13 print(random.uniform(1,3))#1.927109612082716 14 15 16 item=[1,3,5,7,9] 17 random.shuffle(item) 18 print(item)
import random def v_code(): code = '' for i in range(5): num=random.randint(0,9) alf=chr(random.randint(65,90)) add=random.choice([num,alf]) code += str(add) return code print(v_code()) 验证码
六、os模块
os模块是与操作系统交互的一个接口
1 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 2 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd 3 os.curdir 返回当前目录: ('.') 4 os.pardir 获取当前目录的父目录字符串名:('..') 5 os.makedirs('dirname1/dirname2') 可生成多层递归目录 6 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 7 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname 8 os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname 9 os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 10 os.remove() 删除一个文件 11 os.rename("oldname","newname") 重命名文件/目录 12 os.stat('path/filename') 获取文件/目录信息 13 os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/" 14 os.linesep 输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n" 15 os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为: 16 os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix' 17 os.system("bash command") 运行shell命令,直接显示 18 os.environ 获取系统环境变量 19 os.path.abspath(path) 返回path规范化的绝对路径 20 os.path.split(path) 将path分割成目录和文件名二元组返回 21 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 22 os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 23 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False 24 os.path.isabs(path) 如果path是绝对路径,返回True 25 os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False 26 os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False 27 os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 28 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 29 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
七、sys模块
1 sys.argv 命令行参数List,第一个元素是程序本身路径 2 sys.exit(n) 退出程序,正常退出时exit(0) 3 sys.version 获取Python解释程序的版本信息 4 sys.maxint 最大的Int值 5 sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 6 sys.platform 返回操作系统平台名称
进度条:
import sys,time for i in range(10): sys.stdout.write('#') time.sleep(1) sys.stdout.flush()
八、json & pickle
之前我们学习过用eval内置方法将一个字符串转成python对象,不过,eval方法是有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式,并返回表达式的值。
import json x="[null,true,false,1]" #print(eval(x)) print(json.loads(x))
1、什么是序列化?
我们把对象(变量)从内存中变成可存储或者可传输的过程称之为序列化,在python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等。
序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。
反过来,把变量内容从序列化的对象重新读到内存里称之为发序列化,即unpickling。
2、json
如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来的就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。
JSON表示的对象就是标准的JavaScript语言的对象,JSON和python内置的数据类型对应如下:

#----------------------------序列化 import json dic={'name':'alvin','age':23,'sex':'male'} print(type(dic))#<class 'dict'> j=json.dumps(dic) print(type(j))#<class 'str'> f=open('序列化对象','w') f.write(j) #-------------------等价于json.dump(dic,f) f.close() #-----------------------------反序列化<br> import json f=open('序列化对象') data=json.loads(f.read())# 等价于data=json.load(f)
import json #dct="{'1':111}"#json 不认单引号 #dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1} dct='{"1":"111"}' print(json.loads(dct)) #conclusion: # 无论数据是怎样创建的,只要满足json格式,就可以json.loads出来,不一定非要dumps的数据才能loads
3、pickle
1 ##----------------------------序列化 2 import pickle 3 4 dic={'name':'alvin','age':23,'sex':'male'} 5 6 print(type(dic))#<class 'dict'> 7 8 j=pickle.dumps(dic) 9 print(type(j))#<class 'bytes'> 10 11 12 f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes' 13 f.write(j) #-------------------等价于pickle.dump(dic,f) 14 15 f.close() 16 #-------------------------反序列化 17 import pickle 18 f=open('序列化对象_pickle','rb') 19 20 data=pickle.loads(f.read())# 等价于data=pickle.load(f) 21 22 23 print(data['age'])
pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于Python,并且可能不同版本的python彼此都不兼容,因此,只能用pickle保存哪些不重要的数据,不能成功反序列化也没有关系。
九、shelve模块
shelve模块比pickle模块简单,只有一个open函数,返回类似字典的对象,可读可写;key必须为字符串,而值可以是python所支持的数据类型。
十、XML模块
xml是实现不同语言或程序之间数据交换的协议,跟JSON差不多,但JSON使用起来更简单,不过,古时候,在JSON还没诞生的时候,大家只能使用xml,至今很多传统公司如金融行业的很多系统的接口主要还是xml。
xml的格式如下,就是通过<>节点来区别数据结构的:
<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name="Singapore"> <rank updated="yes">5</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N"/> </country> <country name="Panama"> <rank updated="yes">69</rank> <year>2011</year> <gdppc>13600</gdppc> <neighbor name="Costa Rica" direction="W"/> <neighbor name="Colombia" direction="E"/> </country> </data>
xml协议在各个语言里都是支持的,在python中可以使用一下模块操作xml:
import xml.etree.ElementTree as ET tree = ET.parse("xmltest.xml") root = tree.getroot() print(root.tag) #遍历xml文档 for child in root: print(child.tag, child.attrib) for i in child: print(i.tag,i.text) #只遍历year 节点 for node in root.iter('year'): print(node.tag,node.text) #--------------------------------------- import xml.etree.ElementTree as ET tree = ET.parse("xmltest.xml") root = tree.getroot() #修改 for node in root.iter('year'): new_year = int(node.text) + 1 node.text = str(new_year) node.set("updated","yes") tree.write("xmltest.xml") #删除node for country in root.findall('country'): rank = int(country.find('rank').text) if rank > 50: root.remove(country) tree.write('output.xml')
自己创建xml文档:
import xml.etree.ElementTree as ET new_xml = ET.Element("namelist") name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"}) age = ET.SubElement(name,"age",attrib={"checked":"no"}) sex = ET.SubElement(name,"sex") sex.text = '33' name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"}) age = ET.SubElement(name2,"age") age.text = '19' et = ET.ElementTree(new_xml) #生成文档对象 et.write("test.xml", encoding="utf-8",xml_declaration=True) ET.dump(new_xml) #打印生成的格式
十一、re模块
就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。
字符匹配(普通字符,元字符):
- 1 普通字符:大多数字符和字母都会和自身匹配
>>> re.findall('alvin','yuanaleSxalexwupeiqi')
['alvin']
- 2 元字符:. ^ $ * + ? { } [ ] | ( ) \
1、元字符之. ^ $ * + ? { }
1 import re 2 3 ret=re.findall('a..in','helloalvin') 4 print(ret)#['alvin'] 5 6 7 ret=re.findall('^a...n','alvinhelloawwwn') 8 print(ret)#['alvin'] 9 10 11 ret=re.findall('a...n$','alvinhelloawwwn') 12 print(ret)#['awwwn'] 13 14 15 ret=re.findall('a...n$','alvinhelloawwwn') 16 print(ret)#['awwwn'] 17 18 19 ret=re.findall('abc*','abcccc')#贪婪匹配[0,+oo] 20 print(ret)#['abcccc'] 21 22 ret=re.findall('abc+','abccc')#[1,+oo] 23 print(ret)#['abccc'] 24 25 ret=re.findall('abc?','abccc')#[0,1] 26 print(ret)#['abc'] 27 28 29 ret=re.findall('abc{1,4}','abccc') 30 print(ret)#['abccc'] 贪婪匹配
注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配
1 ret=re.findall('abc*?','abcccccc') 2 print(ret)#['ab']
2、元字符之字符集[]:
1 #--------------------------------------------字符集[] 2 ret=re.findall('a[bc]d','acd') 3 print(ret)#['acd'] 4 5 ret=re.findall('[a-z]','acd') 6 print(ret)#['a', 'c', 'd'] 7 8 ret=re.findall('[.*+]','a.cd+') 9 print(ret)#['.', '+'] 10 11 #在字符集里有功能的符号: - ^ \ 12 13 ret=re.findall('[1-9]','45dha3') 14 print(ret)#['4', '5', '3'] 15 16 ret=re.findall('[^ab]','45bdha3') 17 print(ret)#['4', '5', 'd', 'h', '3'] 18 19 ret=re.findall('[\d]','45bdha3') 20 print(ret)#['4', '5', '3']
3、元字符之转义符\
反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d
\d 匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b 匹配一个特殊字符边界,比如空格 ,&,#等
1 ret=re.findall('I\b','I am LIST') 2 print(ret)#[] 3 ret=re.findall(r'I\b','I am LIST') 4 print(ret)#['I']
注意:
1 #-----------------------------eg1: 2 import re 3 ret=re.findall('c\l','abc\le') 4 print(ret)#[] 5 ret=re.findall('c\\l','abc\le') 6 print(ret)#[] 7 ret=re.findall('c\\\\l','abc\le') 8 print(ret)#['c\\l'] 9 ret=re.findall(r'c\\l','abc\le') 10 print(ret)#['c\\l'] 11 12 #-----------------------------eg2: 13 #之所以选择\b是因为\b在ASCII表中是有意义的 14 m = re.findall('\bblow', 'blow') 15 print(m) 16 m = re.findall(r'\bblow', 'blow') 17 print(m)

4、元字符之分组()
1 m = re.findall(r'(ad)+', 'add') 2 print(m) 3 4 ret=re.search('(?P<id>\d{2})/(?P<name>\w{3})','23/com') 5 print(ret.group())#23/com 6 print(ret.group('id'))#23
5、元字符之|
1 ret=re.search('(ab)|\d','rabhdg8sd') 2 print(ret.group())#ab
6、re模块下的常用方法
1 import re 2 #1 3 re.findall('a','alvin yuan') #返回所有满足匹配条件的结果,放在列表里 4 #2 5 re.search('a','alvin yuan').group() #函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以 6 # 通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。 7 8 #3 9 re.match('a','abc').group() #同search,不过尽在字符串开始处进行匹配 10 11 #4 12 ret=re.split('[ab]','abcd') #先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割 13 print(ret)#['', '', 'cd'] 14 15 #5 16 ret=re.sub('\d','abc','alvin5yuan6',1) 17 print(ret)#alvinabcyuan6 18 ret=re.subn('\d','abc','alvin5yuan6') 19 print(ret)#('alvinabcyuanabc', 2) 20 21 #6 22 obj=re.compile('\d{3}') 23 ret=obj.search('abc123eeee') 24 print(ret.group())#123
1 import re 2 ret=re.finditer('\d','ds3sy4784a') 3 print(ret) #<callable_iterator object at 0x10195f940> 4 5 print(next(ret).group()) 6 print(next(ret).group())
注意:
1 import re 2 3 ret=re.findall('www.(baidu|oldboy).com','www.oldboy.com') 4 print(ret)#['oldboy'] 这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可 5 6 ret=re.findall('www.(?:baidu|oldboy).com','www.oldboy.com') 7 print(ret)#['www.oldboy.com']
补充:
import re print(re.findall("<(?P<tag_name>\w+)>\w+</(?P=tag_name)>","<h1>hello</h1>")) print(re.search("<(?P<tag_name>\w+)>\w+</(?P=tag_name)>","<h1>hello</h1>")) print(re.search(r"<(\w+)>\w+</\1>","<h1>hello</h1>"))
补充2:
#匹配出所有的整数 import re #ret=re.findall(r"\d+{0}]","1-2*(60+(-40.35/5)-(-4*3))") ret=re.findall(r"-?\d+\.\d*|(-?\d+)","1-2*(60+(-40.35/5)-(-4*3))") ret.remove("") print(ret)
十二、logging模块
1、简单应用
import logging logging.debug('debug message') logging.info('info message') logging.warning('warning message') logging.error('error message') logging.critical('critical message')
输出:
WARNING:root:warning message
ERROR:root:error message
CRITICAL:root:critical message
可见,默认情况下python的logging模块将日志打印到了标准输出中,且只显示了大于等于WARNING级别的日志,这说明默认的日志级别设置为WARNING(日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET),默认的日志格式为----->日志级别:Logger名称:用户输出消息。
2、灵活使用日志级别,日志格式,输出位置
import logging logging.basicConfig( #1、调整显示级别 level=logging.DEBUG, #2、将日志信息写入文件(不只是打印),采用追加的模式 #filename="logger.log", #3、把日志文件改成写入模式 filemode="w", #4、日志打印的格式 #asctime:时间,lineno:行号,message:要打印的日志信息,filename:运行多的py文件的名称 format="%(asctime)s %(filename)s [line:%(lineno)d] %(message)s", #5、更改时间显示格式 datefmt='%a, %d %b %Y %H:%M:%S', ) logging.debug('debug message') logging.info('info message') logging.warning('warning message') logging.error('error message') logging.critical('critical message')
输出:
Tue, 03 Sep 2019 16:12:52 14-集合与函数.py [line:19] debug message
Tue, 03 Sep 2019 16:12:52 14-集合与函数.py [line:20] info message
Tue, 03 Sep 2019 16:12:52 14-集合与函数.py [line:21] warning message
Tue, 03 Sep 2019 16:12:52 14-集合与函数.py [line:22] error message
Tue, 03 Sep 2019 16:12:52 14-集合与函数.py [line:23] critical message
在logging.basicConfig()函数中可以通过具体参数来更改logging模块默认的行为,可用参数有:
- filename:用于指定的文件名创建FileHandler,这样日志就会被存储在指定的文件中。
- filemode:文件的打开方式,在指定了filename时使用这个参数,默认值为'a',还可以指定为'w'。
- format:指定handler使用的日志显示格式
- datefmt:指定时间的显示格式
- level:设置rootlogger的日志级别
- stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,'w'))
默认是sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。
format参数中可能用到的格式化串:
- %(name)s Logger的名字
- %(levelno)s 数字形式的日志级别
- %(levelname)s 文本形式的日志级别
- %(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
- %(filename)s 调用日志输出函数的模块的文件名
- %(module)s 调用日志输出函数的模块名
- %(funcName)s 调用日志输出函数的函数名
- %(lineno)d 调用日志输出函数的语句所在的代码行
- %(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
- %(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
- %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
- %(thread)d 线程ID。可能没有
- %(threadName)s 线程名。可能没有
- %(process)d 进程ID。可能没有
- %(message)s用户输出的消息
3、logger对象
上述的几个例子中,我们了解到logging.debug()、logging.info()、logging.warning()、logging.erro()、logging.critical()(分别用以记录不同级别的日志信息),logging.basicConfig()(用默认日志格式(Formatter)为日志系统建立一个默认的流处理器(StreamHandler),设置基础配置(如日志级别等)并加到root logger(根Logger)中)这几个logging模块级别的函数,另外,还有一个模块级别函数是logging.getLogger([name])(返回一个logger对象,如果没有指定名字将返回root logger)。
简单示例:
1 import logging 2 #设置logger------------------------------- 3 #吸取功夫 4 logger = logging.getLogger() 5 #1、可以向文件发送信息 6 fh = logging.FileHandler("test_log") 7 #2、可以向控制台发送信息 8 sh = logging.StreamHandler() 9 10 #自定义日志格式 11 formatter = logging.Formatter("'%(asctime)s - %(name)s - %(levelname)s - %(message)s'") 12 fh.setFormatter(formatter) 13 sh.setFormatter(formatter) 14 15 logger.addHandler(fh) 16 logger.addHandler(sh) 17 18 logger.setLevel("DEBUG") 19 20 #操作logger--------------------------- 21 #打印 22 logger.debug('debug message') 23 logger.info('info message') 24 logger.warning('warning message') 25 logger.error('error message') 26 logger.critical('critical message')
logging库提供了多个组件:Logger、Handler、Filter、Formatter。Logger对象提供应用程序可以直接使用的接口,Handler发送日志到适当的目的地(文件、控制台),Filter提供了过滤日志信息的方法,Formatter指定日志的显示格式。
(1)
Logger是一个树形层级结构,输出信息之前都要获取一个Logger(如果没有显示获取,则自动创建并使用root Logger,如logger = logging.getLogger())。
logger = logging.getLogger()返回一个默认的Logger,即root Logger,并应用默认的日志级别,Handler和Formatter设置。当然也可以通过Logger.setLeval(level)设置最低的日志级别。
Logger.debug()、Logger.info()、Logger.warning()、Logger.error()、Logger.critical()输出不同级别的日志,只有日志等级大于或等于设置的日志级别的日志才会被输出。
1 logger.debug('debug message') 2 logger.info('info message') 3 logger.warning('warning message') 4 logger.error('error message') 5 logger.critical('critical message')
输出:
2019-09-03 17:46:37,278 - root - DEBUG - debug message
2019-09-03 17:46:37,279 - root - INFO - info message
2019-09-03 17:46:37,279 - root - WARNING - warning message
2019-09-03 17:46:37,279 - root - ERROR - error message
2019-09-03 17:46:37,280 - root - CRITICAL - critical message
从这个输出可以看出logger = logging.getLogger()返回的Logger名为root。
(2)
如果我们再创建两个logger对象
################################################## logger1 = logging.getLogger('mylogger') logger1.setLevel(logging.DEBUG) logger2 = logging.getLogger('mylogger') logger2.setLevel(logging.INFO) logger1.addHandler(fh) logger1.addHandler(ch) logger2.addHandler(fh) logger2.addHandler(ch) logger1.debug('logger1 debug message') logger1.info('logger1 info message') logger1.warning('logger1 warning message') logger1.error('logger1 error message') logger1.critical('logger1 critical message') logger2.debug('logger2 debug message') logger2.info('logger2 info message') logger2.warning('logger2 warning message') logger2.error('logger2 error message') logger2.critical('logger2 critical message')
输出:
2019-09-03 17:54:25,649 - mylogger - INFO - logger1 info message
2019-09-03 17:54:25,650 - mylogger - WARNING - logger1 warning message
2019-09-03 17:54:25,650 - mylogger - ERROR - logger1 error message
2019-09-03 17:54:25,655 - mylogger - CRITICAL - logger1 critical message
2019-09-03 17:54:25,655 - mylogger - INFO - logger2 info message
2019-09-03 17:54:25,655 - mylogger - WARNING - logger2 warning message
2019-09-03 17:54:25,656 - mylogger - ERROR - logger2 error message
2019-09-03 17:54:25,656 - mylogger - CRITICAL - logger2 critical message
问题:
<1>我们明明通过logger1.setLevel(logging.DEBUG)将logger1的日志级别设置为了DEBUG,为何显示的时候没有显示出DEBUG级别的日志信息,而是从INFO级别的日志开始显示呢?
原来logger1和logger2对应的是同一个Logger实例,只要logging.getLogger(name)中名称参数name相同则返回的Logger实例就是同一个,且仅有一个,也即name与Logger实例一一对应。在logger2实例中通过logger2.setLevel(logging.INFO)设置mylogger的日志级别为logging.INFO,所以最后logger1的输出遵从了后来设置的日志级别。
(3)
1 import logging 2 logger = logging.getLogger() 3 logger.setLevel(logging.WARNING) 4 5 logger1 = logging.getLogger('mylogger') 6 logger1.setLevel(logging.DEBUG) 7 8 fh = logging.FileHandler("test_log") 9 sh = logging.StreamHandler() 10 11 formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s') 12 fh.setFormatter(formatter) 13 sh.setFormatter(formatter) 14 15 logger.addHandler(fh) 16 logger.addHandler(sh) 17 18 logger1.addHandler(fh) 19 logger1.addHandler(sh) 20 21 logger.debug('logger1 debug message') 22 logger.info('logger1 info message') 23 logger.warning('logger1 warning message') 24 logger.error('logger1 error message') 25 logger.critical('logger1 critical message') 26 27 logger1.debug('logger2 debug message') 28 logger1.info('logger2 info message') 29 logger1.warning('logger2 warning message') 30 logger1.error('logger2 error message') 31 logger1.critical('logger2 critical message')
输出:
2019-09-03 18:02:26,966 - root - WARNING - logger1 warning message
2019-09-03 18:02:26,966 - root - ERROR - logger1 error message
2019-09-03 18:02:26,966 - root - CRITICAL - logger1 critical message
2019-09-03 18:02:26,966 - mylogger - DEBUG - logger2 debug message
2019-09-03 18:02:26,966 - mylogger - DEBUG - logger2 debug message
2019-09-03 18:02:26,966 - mylogger - INFO - logger2 info message
2019-09-03 18:02:26,966 - mylogger - INFO - logger2 info message
2019-09-03 18:02:26,966 - mylogger - WARNING - logger2 warning message
2019-09-03 18:02:26,966 - mylogger - WARNING - logger2 warning message
2019-09-03 18:02:26,966 - mylogger - ERROR - logger2 error message
2019-09-03 18:02:26,966 - mylogger - ERROR - logger2 error message
2019-09-03 18:02:26,982 - mylogger - CRITICAL - logger2 critical message
2019-09-03 18:02:26,982 - mylogger - CRITICAL - logger2 critical message
问题:
<2>为什么logger1对应的每个输出分别显示两次?
这是因为我们通过logger =
logging.getLogger()显示的创建了root Logger,而logger1 =
logging.getLogger('mylogger')创建了root
Logger的孩子(root.)mylogger。而孩子,孙子,重孙……既会将消息分发给他的handler进行处理也会传递给所有的祖先Logger处理。
# logger.addHandler(fh)
# logger.addHandler(ch) 注释掉,我们再来看效果:
结果:
控制台:
logger1 warning message
logger1 error message
logger1 critical message
2019-09-03 18:06:50,664 - mylogger - DEBUG - logger2 debug message
2019-09-03 18:06:50,664 - mylogger - INFO - logger2 info message
2019-09-03 18:06:50,664 - mylogger - WARNING - logger2 warning message
2019-09-03 18:06:50,664 - mylogger - ERROR - logger2 error message
2019-09-03 18:06:50,664 - mylogger - CRITICAL - logger2 critical message
文件:test_log
2019-09-03 18:06:50,664 - mylogger - DEBUG - logger2 debug message
2019-09-03 18:06:50,664 - mylogger - INFO - logger2 info message
2019-09-03 18:06:50,664 - mylogger - WARNING - logger2 warning message
2019-09-03 18:06:50,664 - mylogger - ERROR - logger2 error message
2019-09-03 18:06:50,664 - mylogger - CRITICAL - logger2 critical message
因为我们注释了logger对象显示的位置,所以才用了默认方式,即标准输出方式。因为它的父级没有设置文件显示方式,所以在这里只打印了一次。
孩子,孙子,重孙……可逐层继承来自祖先的日志级别、Handler、Filter设置,也可以通过Logger.setLevel(lel)、Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)、Logger.addFilter(filt)、Logger.removeFilter(filt)。设置自己特别的日志级别、Handler、Filter。若不设置则使用继承来的值。
因为我们注释了logger对象显示的位置,所以才用了默认方式,即标准输出方式。因为它的父级没有设置文件显示方式,所以在这里只打印了一次。
孩子,孙子,重孙……可逐层继承来自祖先的日志级别、Handler、Filter设置,也可以通过Logger.setLevel(lel)、Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)、Logger.addFilter(filt)、Logger.removeFilter(filt)。设置自己特别的日志级别、Handler、Filter。若不设置则使用继承来的值。
4、filter
限制只有满足过滤规则的日志才会输出。
比如我们定义了filter = logging.Filter('a.b.c'),并将这个Filter添加到了一个Handler上,则使用该Handler的Logger中只有名字带a.b.c前缀的Logger才能输出其日志。
filter = logging.Filter('mylogger')
logger.addFilter(filter)
这是只对logger这个对象进行筛选
如果想对所有的对象进行筛选,则:
filter = logging.Filter('mylogger')
fh.addFilter(filter)
ch.addFilter(filter)
这样,所有添加fh或者ch的logger对象都会进行筛选。
应用:
import os import time import logging from config import settings def get_logger(card_num, struct_time): if struct_time.tm_mday < 23: file_name = "%s_%s_%d" %(struct_time.tm_year, struct_time.tm_mon, 22) else: file_name = "%s_%s_%d" %(struct_time.tm_year, struct_time.tm_mon+1, 22) file_handler = logging.FileHandler( os.path.join(settings.USER_DIR_FOLDER, card_num, 'record', file_name), encoding='utf-8' ) fmt = logging.Formatter(fmt="%(asctime)s : %(message)s") file_handler.setFormatter(fmt) logger1 = logging.Logger('user_logger', level=logging.INFO) logger1.addHandler(file_handler) return logger1
十三、configparser
需求,生成如下格式的文档:
[DEFAULT] ServerAliveInterval = 45 Compression = yes CompressionLevel = 9 ForwardX11 = yes [bitbucket.org] User = hg [topsecret.server.com] Port = 50022 ForwardX11 = no
用python生成这样的一个文档:
import configparser config = configparser.ConfigParser() config["DEFAULT"] = {'ServerAliveInterval': '45', 'Compression': 'yes', 'CompressionLevel': '9'} config['bitbucket.org'] = {} config['bitbucket.org']['User'] = 'hg' config['topsecret.server.com'] = {} topsecret = config['topsecret.server.com'] topsecret['Host Port'] = '50022' # mutates the parser topsecret['ForwardX11'] = 'no' # same here config['DEFAULT']['ForwardX11'] = 'yes'<br> with open('example.ini', 'w') as configfile: config.write(configfile)
对生成的文档进行增删改查:
import configparser config = configparser.ConfigParser() #---------------------------------------------查 print(config.sections()) #[] config.read('example.ini') print(config.sections()) #['bitbucket.org', 'topsecret.server.com'] print('bytebong.com' in config)# False print(config['bitbucket.org']['User']) # hg print(config['DEFAULT']['Compression']) #yes print(config['topsecret.server.com']['ForwardX11']) #no for key in config['bitbucket.org']: print(key) # user # serveraliveinterval # compression # compressionlevel # forwardx11 print(config.options('bitbucket.org'))#['user', 'serveraliveinterval', 'compression', 'compressionlevel', 'forwardx11'] print(config.items('bitbucket.org')) #[('serveraliveinterval', '45'), ('compression', 'yes'), ('compressionlevel', '9'), ('forwardx11', 'yes'), ('user', 'hg')] print(config.get('bitbucket.org','compression'))#yes #---------------------------------------------删,改,增(config.write(open('i.cfg', "w"))) config.add_section('yuan') config.remove_section('topsecret.server.com') config.remove_option('bitbucket.org','user') config.set('bitbucket.org','k1','11111') config.write(open('i.cfg', "w"))
十四、hashlib模板
用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。
1 import hashlib 2 3 m=hashlib.md5()# m=hashlib.sha256() 4 5 m.update('hello'.encode('utf8')) 6 print(m.hexdigest()) #5d41402abc4b2a76b9719d911017c592 7 8 m.update('alvin'.encode('utf8')) 9 10 print(m.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af 11 12 m2=hashlib.md5() 13 m2.update('helloalvin'.encode('utf8')) 14 print(m2.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af
以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。
import hashlib # ######## 256 ######## hash = hashlib.sha256('898oaFs09f'.encode('utf8')) hash.update('alvin'.encode('utf8')) print (hash.hexdigest())#e79e68f070cdedcfe63eaf1a2e92c83b4cfb1b5c6bc452d214c1b7e77cdfd1c7
python 还有一个 hmac 模块,它内部对我们创建 key 和 内容 再进行处理然后再加密:
import hmac h = hmac.new('alvin'.encode('utf8')) h.update('hello'.encode('utf8')) print (h.hexdigest())#320df9832eab4c038b6c1d7ed73a5940

浙公网安备 33010602011771号