python常用模块3
logging模块
loggin模块是一个专门用来做日志记录的模块。
初识logging
# 日志等级
CRITICAL = 50 #FATAL = CRITICAL
ERROR = 40
WARNING = 30 #WARN = WARNING
INFO = 20
DEBUG = 10
NOTSET = 0 #不设置
# 默认级别为 WARNING(以上的级别的日志才会显示),默认打印到终端
import logging
logging.debug('调试debug')
logging.info('消息info')
logging.warning('警告warn')
logging.error('错误error')
logging.critical('严重critical')
# 输出:
WARNING:root:警告warn
ERROR:root:错误error
CRITICAL:root:严重critical
logging的基本使用
import logging
# logging.basicConfig() 常用的关键字参数:filename, format, datefmt, level
logging.basicConfig(
# 1、日志输出位置:1、终端 2、文件
filename='access.log', # 不指定,默认打印到终端
# 2、日志格式
format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s',
# 3、时间格式
datefmt='%Y-%m-%d %H:%M:%S %p',
# 4、日志级别
# critical => 50
# error => 40
# warning => 30
# info => 20
# debug => 10
level=10, # 设置日志等级10及以上的才会捕获
)
logging.debug('调试debug') # 10
logging.info('消息info') # 20
logging.warning('警告warn')# 30
logging.error('egon提现失败') # 40
logging.critical('严重critical') # 50
# 注意1:这种方式只能选择终端打印或者保存在文件中,无法同时满足。
# 注意2:将日志保存到文件时,无法指定字符编码格式,只能使用操作系统默认的编码格式。但可以修改打开文件的模式,默认使用a模式。
logging的字典配置使用
1 定义日志输出格式时,日志中可能用到的格式化串如下
# 1、定义三种日志输出格式,日志中可能用到的格式化串如下
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s 用户输出的消息
2 定义日志输出格式
# 强调:其中的%(name)s为:调用getlogger(name)时指定的name
standard_format = '%(asctime)s - %(threadName)s:%(thread)d - 日志名字:%(name)s - %(filename)s:%(lineno)d -%(levelname)s - %(message)s'
# 如:2020-04-01 11:03:52,796 - MainThread:140736945378240 - 日志名字:用户常规 - src.py:33 -INFO - logger4产生的info日志
simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'
# 如:[INFO][2020-04-01 14:12:35,278][src.py:33]logger4产生的info日志
test_format = '[%(asctime)s] %(message)s'
# 如:[2020-04-01 14:14:44,457] logger4产生的info日志
3 日志配置字典
LOGGING_DIC = {
'version': 1,
'disable_existing_loggers': False,
'formatters': {
'standard': {
'format': standard_format
},
'simple': {
'format': simple_format
},
'test': {
'format': test_format
},
},
'filters': {},
# handlers是日志的接收者,不同的handler会将日志输出到不同的位置
'handlers': {
# 打印到终端的日志
'console': {
'level': 'DEBUG',
'class': 'logging.StreamHandler', # 打印到屏幕
'formatter': 'test'
},
# 日志轮转设置
'default': {
'level': 'DEBUG',
'class': 'logging.handlers.RotatingFileHandler', # 做日志轮转的handler
# 'maxBytes': 1024*1024*5, # 日志大小 5M
'maxBytes': 1000,
'backupCount': 5,
'filename': 'a1.log',
'encoding': 'utf-8',
'formatter': 'standard',
},
# 打印到文件的日志,收集info及以上的日志
'other': {
'level': 'DEBUG',
'class': 'logging.FileHandler', # 保存到文件
'filename': 'a2.log',
'encoding': 'utf-8',
'formatter': 'test',
},
},
# loggers是日志的产生者,产生的日志会传递给handler然后控制输出
'loggers': {
# 'kkk'是调用logging.getLogger(name)时,name代表的名字,通过'kkk'找logger
'kkk': {
'handlers': ['console','other'],
# 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕
'level': 'DEBUG',
# loggers(第一层日志级别关限制)--->handlers(第二层日志级别关卡限制)
'propagate': False,
# 默认为True,向上(更高level的logger)传递,通常设置为False即可,否则会一份日志向上层层传递
},
'终端提示': {
'handlers': ['console',], # 这里只使用屏幕打印日志信息
'level': 'DEBUG',
'propagate': False,
},
# 当键为空,表示调用logging.getLogger(name),name找不到时,就调用这个空键所对应的设置
'': {
'handlers': ['console', ],
'level': 'DEBUG',
'propagate': False,
},
},
}
# formatters 是事先配置好的日志格式模板,被'handlers'调用使用
# handlers 是日志的接收者,不同的handler会将日志输出到不同的位置(终端&文件), 被loggers调用
# loggers 是日志的产生者,产生的日志会传递给handler然后控制输出
4 使用
from logging import config, getLogger # 导入logging包下面的config子包和getLogger模块
import settings # 使用前先导入日志配置字典LOGGING_DIC
config.dictConfig(settings.LOGGING_DIC) # 调用config.dictConfig()传入配置字典
logger2=getLogger('终端提示') # 通过getLogger()传入要使用的logger
logger2.info('logger2产生的info日志') # 产生日志
logger4=getLogger('用户常规') # 当logger不存在时,调用loggers中空键对应的logger
logger4.info('logger4产生的info日志') # 产生日志
补充
- 日志名的命名:日志名是区别日志业务归属的一种非常重要的标识
- 日志轮转:当日志文件大小达到一定规模时,将老日志备份保存。
使用技巧:
- 将日志配置字典放在项目的
conf文件夹下配置文件中。 - 将使用logging模块的调用功能封装成一个函数工具,放在项目的
lib文件夹下,在主程序中直接调用之。
re模块
正则就是用一些具有特殊含义的符号组合到一起(正则表达式)来描述字符或者字符串的方法。或者说正则就是用来描述一类事物的规则。
在Python中,通过re模块实现;正则表达式模式被编译成一系列的字节码,然后由用c编写的匹配引擎执行。
常用匹配模式(元字符)

# 正则匹配
import re
# 单字符匹配
print(re.findall('\w','aAbc123_*()-=')) # 匹配字母数字下划线
print(re.findall('\W','aAbc123_*()-=\n')) # 匹配非 字母数字下划线
print(re.findall('\s','aA\rbc\t\n12\f3_*()-= ')) # 匹配空白字符
print(re.findall('\S','aA\rbc\t\n12\f3_*()-= ')) # 匹配非空白字符
print(re.findall('\d','aA\rbc\t\n12\f3_*()-= ')) # 匹配数字 [0-9]
print(re.findall('\D','aA\rbc\t\n12\f3_*()-= ')) # 匹配非数字
print(re.findall('\Aalex','alexis alex sb')) # 从字符串起始位置匹配
print(re.findall('sb\Z',' alexis alexsb sb')) # 从字符串结束位置开始匹配(无法识别换行符)
print(re.findall('sb\Z',"""alex
alexis
alex
sb
"""))
# output:
['a', 'A', 'b', 'c', '1', '2', '3', '_']
['*', '(', ')', '-', '=', '\n']
['\r', '\t', '\n', '\x0c', ' ']
['a', 'A', 'b', 'c', '1', '2', '3', '_', '*', '(', ')', '-', '=']
['1', '2', '3']
['a', 'A', '\r', 'b', 'c', '\t', '\n', '\x0c', '_', '*', '(', ')', '-', '=', ' ']
['alex']
['sb']
[]
print(re.findall('^alex','alexis alex sb')) # 匹配开头,推荐使用
print(re.findall('sb$','alexis alex sb')) # 匹配结尾,推荐使用
print(re.findall('sb$',"""alex
alexis
alex
sb
""")) # 可以识别换行符
print(re.findall('^alex$','alexis alex sb')) # 绝对匹配
print(re.findall('^alex$','al ex'))
print(re.findall('^alex$','alex'))
# output:
['alex']
['sb']
['sb']
[]
[]
['alex']
# 重复匹配:| . | * | ? | .* | .*? | + | {n,m} |
#1 . 匹配除了\n之外任意一个字符,指定re.DOTALL之后才能匹配换行符 re.findall('a.b', str, re.DOTALL)
print(re.findall('a.b','a1b a2b a b abbbb a\nb a\tb a*b'))
# ['a1b', 'a2b', 'a b', 'abb', 'a\tb', 'a*b']
#2 * 左侧字符重复0次或多次,贪婪匹配,多少都要没有也可以
print(re.findall('ab*','a ab abb abbbbbbbb bbbbbbbb'))
# ['a', 'ab', 'abb', 'abbbbbbbb']
#3 + 左侧字符重复1次或多次,性格贪婪,即至少要有一个
print(re.findall('ab+','a ab abb abbbbbbbb bbbbbbbb'))
# ['ab', 'abb', 'abbbbbbbb']
#4 ?左侧字符重复0次或1次,性格贪婪,即只要1个或者1个也不要
print(re.findall('ab?','a ab abb abbbbbbbb bbbbbbbb'))
# ['a', 'ab', 'ab', 'ab']
#5 {n,m} 左侧字符重复n次到m次,性格贪婪
# {0,} => *
# {1,} => +
# {0,1} => ?
# {n}单独一个n代表只出现n次,多一次不行少一次也不行
print(re.findall('ab{2,5}','a ab abb abbb abbbb abbbbbbbb bbbbbbbb'))
['abb', 'abbb', 'abbbb', 'abbbbb']
#6 练习:匹配数字
print(re.findall('\d+\.?\d*',"asdfasdf123as1111111.123dfa12adsf1asdf3"))
# ['123', '1111111.123', '12', '1', '3']
#7 [] 匹配指定字符一个,即匹配[]中存放的单个字符
print(re.findall('a[501234]b','a1111111b a3b a4b a9b aXb a b a\nb',re.DOTALL))
# ['a3b', 'a4b']
# 可简写为 [0-5],字母也可以简写为[a-z] 或[A-Z]
print(re.findall('a[0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a\nb',re.DOTALL))
# ['axb', 'a3b', 'a1b', 'a0b', 'a4b', 'a9b', 'aXb']
#8 []中的 ^ 表示取反的意思,这里表示不匹配数字字母
print(re.findall('a[^0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a\nb',re.DOTALL))
# ['a b', 'a\nb']
#9 []中的-可以表示单独的一个字符,但如果-两端有东西的话则表示一个范围0-9, 若仅匹配 - 则要放在表达式的两端
print(re.findall('a[-0-9\n]b','a-b a0b a1b a8b aXb a b a\nb',re.DOTALL))
# ['a-b', 'a0b', 'a1b', 'a8b', 'a\nb']

浙公网安备 33010602011771号