python常用模块3

logging模块

loggin模块是一个专门用来做日志记录的模块。

初识logging

# 日志等级
    CRITICAL = 50 #FATAL = CRITICAL
    ERROR = 40
    WARNING = 30 #WARN = WARNING
    INFO = 20
    DEBUG = 10
    NOTSET = 0 #不设置
    
# 默认级别为 WARNING(以上的级别的日志才会显示)，默认打印到终端
import logging
logging.debug('调试debug')
logging.info('消息info')
logging.warning('警告warn')
logging.error('错误error')
logging.critical('严重critical')
# 输出:
WARNING:root:警告warn
ERROR:root:错误error
CRITICAL:root:严重critical

logging的基本使用

import logging


# logging.basicConfig() 常用的关键字参数：filename, format, datefmt, level
logging.basicConfig(
    # 1、日志输出位置：1、终端 2、文件
    filename='access.log', # 不指定，默认打印到终端

    # 2、日志格式
    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',

    # 3、时间格式
    datefmt='%Y-%m-%d %H:%M:%S %p',

    # 4、日志级别
    # critical => 50
    # error => 40
    # warning => 30
    # info => 20
    # debug => 10
    level=10,		# 设置日志等级10及以上的才会捕获
)


logging.debug('调试debug') # 10
logging.info('消息info')   # 20
logging.warning('警告warn')# 30
logging.error('egon提现失败') # 40
logging.critical('严重critical') # 50


# 注意1：这种方式只能选择终端打印或者保存在文件中，无法同时满足。
# 注意2：将日志保存到文件时，无法指定字符编码格式，只能使用操作系统默认的编码格式。但可以修改打开文件的模式，默认使用a模式。

logging的字典配置使用

1 定义日志输出格式时，日志中可能用到的格式化串如下

# 1、定义三种日志输出格式，日志中可能用到的格式化串如下
    %(name)s 		Logger的名字
    %(levelno)s 	数字形式的日志级别
    %(levelname)s 	文本形式的日志级别
    %(pathname)s 	调用日志输出函数的模块的完整路径名，可能没有
    %(filename)s 	调用日志输出函数的模块的文件名
    %(module)s 		调用日志输出函数的模块名
    %(funcName)s 	调用日志输出函数的函数名
    %(lineno)d 		调用日志输出函数的语句所在的代码行
    %(created)f 	当前时间，用UNIX标准的表示时间的浮点数表示
    %(relativeCreated)d 输出日志信息时的，自Logger创建以来的毫秒数
    %(asctime)s 	字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
    %(thread)d 		线程ID。可能没有
    %(threadName)s 	线程名。可能没有
    %(process)d 	进程ID。可能没有
    %(message)s		用户输出的消息

2 定义日志输出格式

# 强调：其中的%(name)s为：调用getlogger(name)时指定的name

standard_format = '%(asctime)s - %(threadName)s:%(thread)d - 日志名字:%(name)s - %(filename)s:%(lineno)d -%(levelname)s - %(message)s'
# 如：2020-04-01 11:03:52,796 - MainThread:140736945378240 - 日志名字:用户常规 - src.py:33 -INFO - logger4产生的info日志

simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'
# 如：[INFO][2020-04-01 14:12:35,278][src.py:33]logger4产生的info日志

test_format = '[%(asctime)s] %(message)s'
# 如：[2020-04-01 14:14:44,457] logger4产生的info日志

3 日志配置字典

LOGGING_DIC = {
    'version': 1,
    'disable_existing_loggers': False,

    'formatters': {
        'standard': {
            'format': standard_format
        },
        'simple': {
            'format': simple_format
        },
        'test': {
            'format': test_format
        },
    },
    
    
    'filters': {},


    # handlers是日志的接收者，不同的handler会将日志输出到不同的位置
    'handlers': {
        # 打印到终端的日志
        'console': {
            'level': 'DEBUG',
            'class': 'logging.StreamHandler',  # 打印到屏幕
            'formatter': 'test'
        },
        # 日志轮转设置
        'default': {
            'level': 'DEBUG',
            'class': 'logging.handlers.RotatingFileHandler',  # 做日志轮转的handler
            # 'maxBytes': 1024*1024*5,  # 日志大小 5M
            'maxBytes': 1000,
            'backupCount': 5,
            'filename': 'a1.log', 
            'encoding': 'utf-8',
            'formatter': 'standard',
        },
        # 打印到文件的日志,收集info及以上的日志
        'other': {
            'level': 'DEBUG',
            'class': 'logging.FileHandler',  # 保存到文件
            'filename': 'a2.log',
            'encoding': 'utf-8',
            'formatter': 'test',
        },
    },


    # loggers是日志的产生者，产生的日志会传递给handler然后控制输出
    'loggers': {
        # 'kkk'是调用logging.getLogger(name)时，name代表的名字，通过'kkk'找logger
        'kkk': {
            'handlers': ['console','other'],  
            # 这里把上面定义的两个handler都加上，即log数据既写入文件又打印到屏幕
            'level': 'DEBUG', 
            # loggers(第一层日志级别关限制)--->handlers(第二层日志级别关卡限制)
            'propagate': False,  
            # 默认为True，向上（更高level的logger）传递，通常设置为False即可，否则会一份日志向上层层传递
        },
        '终端提示': {
            'handlers': ['console',], 	# 这里只使用屏幕打印日志信息
            'level': 'DEBUG',  
            'propagate': False,
        },
        # 当键为空，表示调用logging.getLogger(name)，name找不到时，就调用这个空键所对应的设置
        '': {
            'handlers': ['console', ],
            'level': 'DEBUG',
            'propagate': False,
        },
    },
}

# formatters 是事先配置好的日志格式模板，被'handlers'调用使用
# handlers 是日志的接收者，不同的handler会将日志输出到不同的位置(终端&文件), 被loggers调用
# loggers 是日志的产生者，产生的日志会传递给handler然后控制输出

4 使用

from logging import config, getLogger	# 导入logging包下面的config子包和getLogger模块
import settings		# 使用前先导入日志配置字典LOGGING_DIC


config.dictConfig(settings.LOGGING_DIC)		# 调用config.dictConfig()传入配置字典

logger2=getLogger('终端提示')				# 通过getLogger()传入要使用的logger
logger2.info('logger2产生的info日志')		# 产生日志

logger4=getLogger('用户常规')				# 当logger不存在时，调用loggers中空键对应的logger
logger4.info('logger4产生的info日志')		# 产生日志

补充

日志名的命名：日志名是区别日志业务归属的一种非常重要的标识
日志轮转：当日志文件大小达到一定规模时，将老日志备份保存。

使用技巧：

将日志配置字典放在项目的conf文件夹下配置文件中。
将使用logging模块的调用功能封装成一个函数工具，放在项目的lib文件夹下，在主程序中直接调用之。

re模块

正则就是用一些具有特殊含义的符号组合到一起（正则表达式）来描述字符或者字符串的方法。或者说正则就是用来描述一类事物的规则。

在Python中，通过re模块实现；正则表达式模式被编译成一系列的字节码，然后由用c编写的匹配引擎执行。

常用匹配模式(元字符)

# 正则匹配
import re

# 单字符匹配
print(re.findall('\w','aAbc123_*()-='))				# 匹配字母数字下划线
print(re.findall('\W','aAbc123_*()-=\n'))			# 匹配非 字母数字下划线
print(re.findall('\s','aA\rbc\t\n12\f3_*()-= '))	# 匹配空白字符
print(re.findall('\S','aA\rbc\t\n12\f3_*()-= '))	# 匹配非空白字符
print(re.findall('\d','aA\rbc\t\n12\f3_*()-= '))	# 匹配数字 [0-9]
print(re.findall('\D','aA\rbc\t\n12\f3_*()-= '))	# 匹配非数字
print(re.findall('\Aalex','alexis alex sb'))		# 从字符串起始位置匹配
print(re.findall('sb\Z',' alexis alexsb sb'))		# 从字符串结束位置开始匹配（无法识别换行符）
print(re.findall('sb\Z',"""alex
alexis
alex
sb
"""))
# output:
['a', 'A', 'b', 'c', '1', '2', '3', '_']
['*', '(', ')', '-', '=', '\n']
['\r', '\t', '\n', '\x0c', ' ']
['a', 'A', 'b', 'c', '1', '2', '3', '_', '*', '(', ')', '-', '=']
['1', '2', '3']
['a', 'A', '\r', 'b', 'c', '\t', '\n', '\x0c', '_', '*', '(', ')', '-', '=', ' ']
['alex']
['sb']
[]

print(re.findall('^alex','alexis alex sb'))		# 匹配开头，推荐使用
print(re.findall('sb$','alexis alex sb'))		# 匹配结尾，推荐使用
print(re.findall('sb$',"""alex					
alexis
alex
sb
"""))										# 可以识别换行符
print(re.findall('^alex$','alexis alex sb'))	# 绝对匹配
print(re.findall('^alex$','al       ex'))
print(re.findall('^alex$','alex'))
# output:
['alex']
['sb']
['sb']
[]
[]
['alex']


# 重复匹配：| . | * | ? | .* | .*? | + | {n,m} |

#1 . 匹配除了\n之外任意一个字符，指定re.DOTALL之后才能匹配换行符 re.findall('a.b', str, re.DOTALL)
print(re.findall('a.b','a1b a2b a b abbbb a\nb a\tb a*b'))
# ['a1b', 'a2b', 'a b', 'abb', 'a\tb', 'a*b']

#2 * 左侧字符重复0次或多次，贪婪匹配，多少都要没有也可以
print(re.findall('ab*','a ab abb abbbbbbbb bbbbbbbb'))	
# ['a', 'ab', 'abb', 'abbbbbbbb']

#3 + 左侧字符重复1次或多次，性格贪婪，即至少要有一个
print(re.findall('ab+','a ab abb abbbbbbbb bbbbbbbb'))
# ['ab', 'abb', 'abbbbbbbb']

#4 ？左侧字符重复0次或1次，性格贪婪,即只要1个或者1个也不要
print(re.findall('ab?','a ab abb abbbbbbbb bbbbbbbb'))
# ['a', 'ab', 'ab', 'ab']

#5 {n,m} 左侧字符重复n次到m次，性格贪婪
# {0,} => *
# {1,} => +
# {0,1} => ?
# {n}单独一个n代表只出现n次，多一次不行少一次也不行
print(re.findall('ab{2,5}','a ab abb abbb abbbb abbbbbbbb bbbbbbbb'))
['abb', 'abbb', 'abbbb', 'abbbbb']


#6 练习：匹配数字
print(re.findall('\d+\.?\d*',"asdfasdf123as1111111.123dfa12adsf1asdf3"))
# ['123', '1111111.123', '12', '1', '3']

#7 [] 匹配指定字符一个，即匹配[]中存放的单个字符
print(re.findall('a[501234]b','a1111111b a3b a4b a9b aXb a b a\nb',re.DOTALL))
# ['a3b', 'a4b']
# 可简写为 [0-5],字母也可以简写为[a-z] 或[A-Z] 
print(re.findall('a[0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a\nb',re.DOTALL))
# ['axb', 'a3b', 'a1b', 'a0b', 'a4b', 'a9b', 'aXb']

#8 []中的 ^ 表示取反的意思，这里表示不匹配数字字母
print(re.findall('a[^0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a\nb',re.DOTALL))
# ['a b', 'a\nb']

#9 []中的-可以表示单独的一个字符，但如果-两端有东西的话则表示一个范围0-9, 若仅匹配 - 则要放在表达式的两端
print(re.findall('a[-0-9\n]b','a-b a0b a1b a8b aXb a b a\nb',re.DOTALL))
# ['a-b', 'a0b', 'a1b', 'a8b', 'a\nb']

posted @ 2020-04-01 16:26 the3times 阅读(149) 评论(0) 收藏举报

刷新页面返回顶部