常用模块学习

本节大纲

 1 模块介绍
 2 Time&datetime
 3 Random
 4 Os
 5 Sys
 6 Shutil
 7 Json & picle
 8 Shelve
 9 Xml处理
10 Yaml处理
11 Configparser
12 Hashlib
13 Subprocess
14 Logging
15 Re正则表达式

模块介绍:

模块:

用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是.py结尾的python文件(文件名:文件名为test.py,模块名:test)

程序包:

         用来从逻辑上组织模块,本质是一个目录(必须带有一个__init__.py文件)。

使用方法:

1         Import  module_name
2     From module_name import *
3     From module_name import m1,m2,m3
4     From module_name import logger as logger_xxx  #如果在改文件下有相同函数,重命名再调用。

Import本质:

1 Import module_name 相当于将module_name中module_name.py所有的代码赋值给module_name调用;
2 From module_name import m1相当于已经定义了某个函数或者变量,直接使用。
3     导入模块的本质就是把python文件解释一遍。
4     导入一个程序包import 文件夹的本质就是执行该包下的__init__.py文件
5     导入不通目录时添加路径:
6     base = os.path.dirname(os.path.abspath(__file__))
7 sys.path.append(base)

导入优化:

 1 每次会去寻找mud.name,怎么优化呢?
 2     import mud
 3 
 4 def all():
 5     mud.name()
 6     print("这是number")
 7 
 8 def search():
 9     mud.name()
10     print("这是search")
11 
12 优化方案:
13 
14 from mud import name
15 
16 def all1():
17         name()
18         print("这是number")
19 
20 def search2():
21         name()
22         print("这是search")

 

Time&datetime

Time:import time  

 

在Python中,通常有这几种方式来表示时间:
    1.时间戳
    2.格式化的时间字符串
    3.元组(struct_time)
共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。
UTC(Coordinated Universal Time,世界协调时)亦即格林威治天问世间,世界标准时间。在
中国为UTC+8。DST(Daylight Saving Time)中国夏令时。
    时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回float类型。返回时间戳方式的函数主要有time(),clock()等。
    元组(struct_time)方式:struct_time元组共有9个元素,返回struct_time的函数主要有gmtime(),localtime(),strptime().下面列出这种方式元组中的几个元素:
gmtime:

>>> time.gmtime(31536000)

time.struct_time(tm_year=1971, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=

0, tm_wday=4, tm_yday=1, tm_isdst=0)

time.localtime和time.mktime(x)间的转换:

>>> time.localtime()

time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=10, tm_min=59, tm_

sec=41, tm_wday=4, tm_yday=300, tm_isdst=0)

 

>>> x = time.localtime()

>>> time.mktime(x)

1509073402.0

strftime:

>>> x = time.localtime()

>>> time.strftime("%Y-%m-%d %H:%M:%S",x) 解释%Y == x.tm_year

'2017-10-27 11:03:22'


strptime:

>>> time.strptime('2017-10-27 11:03:22',"%Y-%m-%d %H:%M:%S")

time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=11, tm_min=3, tm_s

ec=22, tm_wday=4, tm_yday=300, tm_isdst=-1)

asctime:

>>> time.asctime()

'Fri Oct 27 14:52:02 2017'

>>> time.asctime((2017,12,10,14,12,10,10,3,10))

'Thu Dec 10 14:12:10 2017'

Ctime:

>>> time.ctime()

'Fri Oct 27 14:56:55 2017'

>>> time.ctime(100)

'Thu Jan  1 08:01:40 1970'

 

Datetime:import datetime

>>> datetime.datetime.now()
datetime.datetime(2017, 10, 27, 15, 0, 56, 32101) #当前时间

>>> datetime.datetime.now()+datetime.timedelta(3) #修改时间到3天后
datetime.datetime(2017, 10, 30, 15, 1, 55, 331101)

>>> datetime.datetime.now()+datetime.timedelta(-3) #修改时间到3天前
datetime.datetime(2017, 10, 24, 15, 2, 20, 788101)

>>> datetime.datetime.now()+datetime.timedelta(hours=3) #修改时间到3小时后
datetime.datetime(2017, 10, 27, 18, 2, 55, 763101)

>>> datetime.datetime.now()+datetime.timedelta(hours=-3) #修改时间到3小时前
datetime.datetime(2017, 10, 27, 12, 3, 13, 788101)

 

Random:import random


random.random()
#用于生成一个0到1的随机浮点数:0<= N <1.0

random.randint(1,4)
#函数原型为random.randint(a,b),用于生成一个指定范围内的整数。结果指的是整数

random.randrange(10)
#函数原型为:random.randrange([start],stop[,step]);
#从指定范围内,按指定基数递增的集合中获取一个随机数。如random.randrange(10,100,2)。结果指的是范围
#random.randrange(10,100,2)在结果上与random.choice(range(10,100,2))等效。

random.choice('xxx')
#random.choice从序列中获取一个随机元素。
#其函数原型为:random.choice(sequence).参数sequence表示一个有序类型。
#这里要说明下:sequence在python不是一种特定的类型,二十泛指一系列的类型。
#list,tuple,字符串都属于sequence。有关sequence可以查看python手册数据模型一章。

random.sample([1,2,3],2)
#random.sample的函数原型为random.sample(sequence,k),从指定序列中随机获取指定长度的片段,K不能超过总长度。

items = [1,2,3,4,5,6]
#列表都是有顺序的,怎么让他无序呐
random.shuffle(items)
print(items)
#可以看见通过shuffle函数列表的顺序变了


#简单的随机数字游戏
#该列子加列表是为了突出字符是循环单个组成的

#check = ''
check = []

for i in range(5):
    num = random.randrange(5)
    if num == i:
        tmp = chr(random.randint(60,100))
    else:
        tmp = random.randint(0,9)
    check.append(str(tmp))
print(check)

 

os

import os

os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  #改变当前脚本工作目录;相当于shell下cd
os.curdir  #返回当前目录: ('.')
os.pardir  #获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2')    #可生成多层递归目录
os.removedirs('dirname1')    #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    #生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  #删除一个文件
os.rename("oldname","newname")  #重命名文件/目录
os.stat('path/filename')  #获取文件/目录信息
os.sep    #输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep    #输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
os.pathsep    #输出用于分割文件路径的字符串
os.name    #输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  #运行shell命令,直接显示
os.environ  #获取系统环境变量
os.path.abspath(path)  #返回path规范化的绝对路径
os.path.split(path)  #将path分割成目录和文件名二元组返回
os.path.dirname(path)  #返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  #返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  #如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  #如果path是绝对路径,返回True
os.path.isfile(path)  #如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  #如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, #path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.join('e','目录名字')
os.path.getatime(path)  #返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  #返回path所指向的文件或者目录的最后修改时间os.path.exists()

 sys模块

sys.argv #命令行参数List,第一个元素是程序本身路径
sys.exit() #退出程序,正常退出时exit(0)
sys.path    #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.version #获取python的版本信息
sys.platform   #返回操作系统平台名称

等待进度条:
1 for i in  range(10):
2     sys.stdout.write('#')
3     sys.stdout.flush()
4     time.sleep(0.5)

shutil模块

shutil.copyfileobj(x,b) #复制文件x到b
example:
f11 = open('f1','r')
f22 = open('f2','w')
shutil.copyfileobj(f11,f22)
f11.close()
f22.close()


shutil.copyfile('f1','f2') #直接写入文件名字进行文件复制。

shutil.copymode('f1','f3') #根据当前用户的umask接受权限。内容、组、用户、均不变。

shutil.copystat('f1','f3') #使用copystat()只会复制与文件关联的权限和日期。

shutil.copy(src,dst) #复制一个文件到一个文件或一个目录。

shutil.copy2(src,dst)      #在copy上的基础上再复制文件最后访问时间与修改时间也复制过来了,类似于cp –p的东西。

shutil.copytree( olddir, newdir, True/Flase) #把olddir拷贝一份newdir,如果第3个参数是True,则复制目录时将保持文件夹下的符号连接,如果第3个参数是False,则将在复制的目录下生成物理副本来替代符号连接。

shutil.rmtree('src') #删除目录。

shutil.make_archive(base_name,format,..)
#shutil.make_archive('D:\\pythonl\\nn','zip','D:\\pythonl\\M') 将M这个目录打包到指定目录D:\\pythonl下,并起名为nn.zip压缩包
#创建压缩包并返回文件路径,例如:zip,tar
#base_name:压缩包的文件名,也可以是压缩包的路径。只是文件名时,则保存至当前目录,否则保存至指定路径。
#如:www ==》 保存至当前路径
#如:/user/www ==》保存至/User/xxx
#format:压缩包种类,‘zip’,‘tar’,‘bztar’,‘gztar’
#root_dir:要压缩的文件夹路径(默认当前目录)
#owner:用户,默认当前用户
#group:组,默认当前组
#logger:用于记录日志,通常是logging.logger对象

 

zipfile模块

 

 1 import zipfile
 2 
 3 #压缩文件
 4 z = zipfile.ZipFile("11-1.zip","w")
 5 
 6 z.write("f3")
 7 z.write("f1")
 8 
 9 z.close()
10 
11 #解压文件
12 z = zipfile.ZipFile("11-1.zip","r")
13 z.extractall()
14 z.close()

configparser模块

configParser 模块用于操作配置文件,注:Parser汉译为“解析”之意。

import configparser

config = configparser.ConfigParser() #创建ConfigParser实例

#第一种写法
config['DEFAULT]'] = {'ServerAliveInterval':'45',
'Compression':'yes',
'CompressionLevel':'9',
'ForwardX11':'yes'
}

#第二种写法
config['bitbucket.org'] = {}
config['bitbucket.org']['User'] ='hg'

config['topsecret.server.com']={}
config['topsecret.server.com']['Port'] ='50022'
config['topsecret.server.com']['ForwardX11'] ='no'

#将上面内容写入文件中
with open('f2','w') as  configfile:
    config.write(configfile)
#生成文件内容如下
conf.read('f2') #读取配置文件  conf['bitbucket.org']['user'] #返回值hg

 hashlib模块

import hashlib

"""用于加密相关的操作,3.X里代替了md5模块和啥模块,主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法"""

例子:
m = hashlib.md5()
m.update(b"hhhh")
print(m.hexdigest())
m.update(b'xxx')
print(m.hexdigest())

结果:

 


 logging模块

logging模块提供了标准的日志接口,你可以通过它存储各式格式的日志,logging的日志可以分为debug(),info(),warning(),error()and critical()5个级别
日志级别大小关系为:CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET。
#日志级别从大到小
1  logging.critical("server is run")
2  logging.error("error...")
3  logging.warning("user ....login in")
4  logging.info("This is info.")
5  logging.debug("debug...")
#将日志输入文件
1 logging.basicConfig(filename='f3',level=logging.INFO,
2                     format='%(name)s %(filename)s %(funcName)s %(module)s %(lineno)d %(created)f  %(relativeCreated)d %(asctime)s  %(message)s',
3                     datefmt='%m/%d/%Y %I:%M:%S %p')
4 def run():
5     logging.info("xxx")
6 
7 run() #函数调用
#日志格式

%(name)s          #Logger的名字

%(levelno)s                 #数字形式的日志级别

%(levelname)s         #文字形式的日志级别

%(pathname)s           #调用日志输出函数的模块的完整路径名。可能没有

%(filename)s             #调用日志输出函数的模块的文件名

%(module)s          #调用日志输出函数的模块名

%(funcName)s              #调用日志输出函数的函数名

%(lineno)d          #调用日至输出函数的语句所在的代码行

%(created)f            # 当前时间,用UNIX标准的表示时间的浮点数表示

%(relativeCreated)d       #输出日志信息时,自Logger创建以来的毫秒数

%(asctime)s       #字符串形式的当前时间,默认格式“11/02/2017 04:32:51,98”.逗号后面是毫秒

%(message)s                #用户输出消息

%(thread)s                   #线程ID。可能没有

%(process)s                #进程ID。可能没有

%(threadName)s       #线程名。可能没有

 
# Python 使用logging模块记录日志涉及四个主要类,使用官方文档中的概括最为合适:
# 1.logger提供了应用程序可以直接使用的接口
# 2.handler将(logger创建的)日志记录发送到合适的目的输出
# 3.filter提供了细度设备来决定输出哪条日志记录
# 4.formatter决定日志记录的最终输出格式
#
# logger
# 每个程序在输出信息之前都要获得一个Logger。logger通常对应了程序的模块名。比如聊天工具的图形界面模块:
# LOG = logging.getLogger("chat.gui")
# 核心模块:
# LOG = logging.getLogger("chat.kernel")

Logger接口例子:

import logging 
#
创建一个logger logger = logging.getLogger('test') logger.setLevel(logging.DEBUG) #创建一个handler 和设置级别,屏幕上展示 ch = logging.StreamHandler() ch.setLevel(logging.WARNING) #创建一个handler和设置一个级别,写入到文件里面 fh = logging.FileHandler("access.log",encoding='utf-8') #如果不加,中文是乱码 fh.setLevel(logging.ERROR) #定义一个日志格式 ch_format=logging.Formatter('%(name)s - %(filename)s - %(asctime)s - %(message)s') fh_format=logging.Formatter('%(name)s %(filename)s %(asctime)s %(message)s') #结合起来 ch.setFormatter(ch_format) fh.setFormatter(fh_format) logger.addHandler(ch) logger.addHandler(fh) logger.warning("这是警告级别") #因为日志级别为WARNING,所以只有屏幕展示,不符合文件写入级别,所以文件无内容 logger.error("这是错误级别") #符合文件和屏幕日志级别,都展示

日志自动截断 

 
 1 import logging
 2 import time
 3 from logging import handlers
 4 
 5 logger = logging.getLogger('test')
 6 
 7 log_file ="timelog.log"
 8 
 9 #定义日志大小最大10个字节,2个文件
10 #除了日志大小截断,还可以根据时间,when参数是一个字符串。表示时间间隔单位,不区分大小写,他以下取值:
11 #S秒,M分,H小时,D天,W每星期(interval==0时代表星期一),midnight每天凌晨
12 
13 #fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=2)
14 fh = handlers.TimedRotatingFileHandler(filename=log_file,when='S',backupCount=2)
15 
16 
17 
18 
19 formatter = logging.Formatter('%(asctime)s %(module)s %(message)s')
20 
21 fh.setFormatter(formatter)
22 
23 logger.addHandler(fh)
24 
25 #logging开始调用
26 logger.warning("1")
27 logger.warning("12")
28 logger.warning("123")
29 time.sleep(2)
30 logger.warning("12345")
31 logger.warning("13456789")

 re模块

常用正则表达式符号:

 1 '.'     默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
 2 '^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
 3 '$'     匹配字符结尾,或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以
 4 '*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
 5 '+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
 6 '?'     匹配前一个字符1次或0次
 7 '{m}'   匹配前一个字符m次
 8 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
 9 '|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
10 '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
11  
12  
13 '\A'    只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的
14 '\Z'    匹配字符结尾,同$
15 '\d'    匹配数字0-9
16 '\D'    匹配非数字
17 '\w'    匹配[A-Za-z0-9]
18 '\W'    匹配非[A-Za-z0-9]
19 's'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
20  
21 '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}

最常用的匹配语法

 1 re.match 从头开始匹配
 2 re.search 匹配包含
 3 >>> a = re.search("(\d{1,3}\.){3}\d{1,3}","inet 192.168.15.111 netmask 0xffffff00
 4 >>> a
 5 <_sre.SRE_Match object; span=(5, 19), match='192.168.15.111'>
 6 >>> a.group()
 7 '192.168.15.111'
 8 
 9 
10 re.findall 把所有匹配到的字符放到以列表中的元素返回
11 >>> re.findall("\d+","asdasd1231zxc222")
12 ['1231', '222']
13 
14 re.splitall 以匹配到的字符当做列表分隔符
15 >>> re.split("\d+","asdasd1231zxc222dd")
16 ['asdasd', 'zxc', 'dd']
17 
18 re.sub      匹配字符并替换 
19 >>> re.sub("\d+","|","asdasd1231zxc222dd123vvgh",count=2)
20 'asdasd|zxc|dd123vvgh'

 

posted @ 2017-10-26 18:02  橙子味的萝卜  阅读(179)  评论(0编辑  收藏  举报