python之模块2
1.logging模块
等级
debug--->info--->warning(默认)--->error--->critical
配置两种方式:
#1.congfig函数
logging.basicConfig(level=logging.DEBUG,#设置等级
format="%(asctime)s---%(message)s",#文件格式
filename="logger",#设置文件名
filemode="a"#文件模式)
logging.debug("message")
num=1000
logging.info("cost %s"%num)
logging.info("message")
logging.warning("message")
logging.error("message")
logging.critical("message")
import logging

注意:流向只能有一个,屏幕或者文件
#2.logger 是一个对象
logger=logging.getLogger()
# print(logger)在模块中产生一个对象
fh=logging.FileHandler("logger2")#产生一个文件对象
sh=logging.StreamHandler()#产生一个屏幕输出对象
logger.setLevel("DEBUG")#logger对象设定等级
fm=logging.Formatter("%(asctime)s - %(name)s - %(levelname)s - %(message)s")
#产生一个格式
fh.setFormatter(fm)
#文件对象引用格式
sh.setFormatter(fm)
#屏幕对象引用格式
logger.addHandler(fh)
logger.addHandler(sh)
logging.debug("message")
logging.info("message")
logging.warning("message")
logging.error("message")
logging.critical("message")
2.JSON模块
把对象(变量)从内存中变成可存储或传输的过程称之为序列化;反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,并返回表达式的值。
JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,而且可以直接在web页面中读取,非常方便。
JSON和Python内置的数据类型对应如下:

import json
d={"name":"egon"}
s=json.dumps(d)#将字典d转为json字符串--->序列化过程
print(s)
print(type(s))
f=open("new","w")#产生一个文件
f.write(s)#写入内容
f.close()
# ------------------------>
# dump用法
f=open("new2","w")
json.dump(d,f)#--->转成josn字符串,将json字符串写入f里
# ------------------------>
f=open("new")#读取内容
data=f.read()
data2=json.loads(data)#反序列化过程
print(data2["name"])
import json
f=open("new3")
data=f.read()
res=json.loads(data)#只要是满足json格式的字符串
# 就可以使用loads反序列
print(res["name"])
数据类型表示
import json
i=10
s='hello'
t=(1,4,6)
l=[3,5,7]
d={'name':"yuan"}
json_str1=json.dumps(i)
json_str2=json.dumps(s)
json_str3=json.dumps(t)
json_str4=json.dumps(l)
json_str5=json.dumps(d)
print(json_str1) #'10'
print(json_str2) #'"hello"'
print(json_str3) #'[1, 4, 6]'
print(json_str4) #'[3, 5, 7]'
print(json_str5) #'{"name": "yuan"}'
3.RE模块(正则表达式)
正则表达式是一种小型的、高度专业化的编程语言,它内嵌在python中,并通过re模块实现。
对字符串的模糊匹配
Re.findall()找到所有的匹配元素,返回一个列表

- 普通字符:大多数字符和字母都会和自身匹配(精准匹配)
import re print(re.findall("alex","dfuhualalex")) >> ['alex'] - Findall(“规则匹配的字符串”,“需要匹配的字符串”) 匹配的字符串中有几个成功的都会显示
import re print(re.findall("a..x","assxdfuhualalex")) >> ['assx', 'alex'] - 元字符:(1.). 通配符:什么都可以代表。除了\n匹配不上,其他都可以匹配
import re print(re.findall("a....x","dfuhualalmmex")) >> ['almmex'] import re res=re.findall("p\n....h","hello python p\nnsdfh")#规则匹配加\n属于普通匹配 print(res) >> ['p\nnsdfh'](2)^ 必须在字符串的开头匹配,否则匹配不成功
import re print(re.findall("^a..x","assxdfuhualalex")) >> ['assx'](3)$ 在字符串结尾匹配
import re print(re.findall("a..x$","assxdfuhualalex")) >> ['alex'](4)*重复符号(贪婪匹配) 匹配零到无穷次{0,}
import re print(re.findall("alex*","asalexgnnkfnale")) >> ['alex', 'ale'](5) +重复符号(贪婪匹配) 匹配一到无穷次{1,}
import re print(re.findall("alex+","asalexgnnkfnale")) >> ['alex'](6)? 重复符号(贪婪匹配) 匹配零到一次{0,1}
import re print(re.findall("alex?","asalexxxgnnkfnale")) >> ['alex', 'ale'](7) {} 万能的,想取几次取几次 可以表示* + ?
{加想要的次数}
import re print(re.findall("alex{2}","asalexxxgnnkfnale")) >> ['alexx']注意:贪婪匹配就是尽可能匹配,后面写?就变成惰性匹配
import re print(re.findall("alex*?","asalexxxgnnkfnale")) >> ['ale', 'ale'] import re print(re.findall("alex+?","asalexxxgnnkfnale")) >> ['alex'] import re print(re.findall("alex??","asalexxxgnnkfnale")) >> ['ale', 'ale'] - 字符集[] 表示或者 在字符集中有特殊意义的只有
(1)\
(2)-
import re res=re.findall("a[1-9]","a423bx56")#字符集显示1到9的一个 print(res) >> ['a4'] import re res=re.findall("a[1-9]*","a423bx56")#[]后面+* 表示a,一个数字,0-无穷次 print(res) >> ['a423'](3)^ 非以它开头的
import re print(re.findall("q[^a-z]","qa")) >> [] import re res=re.findall("[^\d]","a423bx56a")#取不是数字的 print(res) >> ['a', 'b', 'x', 'a'] import re res=re.findall("[^\d]+","a423bx56a")#取不是数字,1到无穷 print(res) >> ['a', 'bx', 'a']注意:字符集中把部分符号变成了普通符号
-
\字符 转译反斜杠后面跟元字符去除特殊功能\. \*
反斜杠后面跟普通字符时限内特殊功能 \d \w
\d 匹配任何十进制数;它相当于类 [0-9]
练习:求小数 import re res=re.findall("\d+\.?\d*\*\d+\.?\d*","2*6+7*45+1.4*3-8/4") print(res) >> ['2*6', '7*45', '1.4*3'] 求负数 print(re.findall("-{0,1}\d+\.?\d*\*\d+\.?\d*","2*6.000+7*45-1.4567*3-8/4")) print(re.findall("-?\d+\.?\d*\*\d+\.?\d*","2*6.000+7*45-1.4567*3-8/4")) >> ['2*6.000', '7*45', '-1.4567*3'] import re print(re.findall("\d","12+24*8-(3+5*7)")) >> ['1', '2', '2', '4', '8', '3', '5', '7'] import re print(re.findall("\d*","12+24*8-(3+5*7)")) >> ['12', '', '24', '', '8', '', '', '3', '', '5', '', '7', '', '']\D 匹配任何非数字字符;它相当于类 [^0-9]
import re print(re.findall("\D","12+24*8-(3+5*7)")) >> ['+', '*', '-', '(', '+', '*', ')']\s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]
import re print(re.findall("\s","hello world")) >> [' ']\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]
import re print(re.findall("\S","hello world")) >> ['h', 'e', 'l', 'l', 'o', 'w', 'o', 'r', 'l', 'd'] import re print(re.findall("\S+","hello world")) >> ['hello', 'world']\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]
import re print(re.findall("\w","heLlo worlD")) >> ['h', 'e', 'L', 'l', 'o', 'w', 'o', 'r', 'l', 'D']\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
import re print(re.findall("\W","heLlo worlD")) >> [' ']\b 匹配一个特殊字符边界,比如空格 ,&,#等
import re print(re.findall("i","i an list")) >> ['i', 'i'] import re print(re.findall("i\\b","hello i an list")) >> ['i']import re print(re.findall(r"i\b","hello i an list"))#原生字符串,r后面的字符串不做任何转译 >> ['i']
\ 转译普通字符
import re print(re.findall("www*baidu","www*baidu")) >> [''] import re print(re.findall("www\*baidu","www*baidu")) ['www*baidu']反斜杠转译过程
解释器-------> re模块
-
() 元字符 无命名分组
括号前面加\代表普通字符
import re res=re.findall("(ad)+","addd") print(res) >> ['ad']import re res=re.findall("(ad)+yuan","addyuangf") #匹配到ad,第二个d时不成功 print(res) >> ['ad']注意:?:取消优先级
import re res=re.findall("(\d)+yuan","adad7842yuan46gf") print(res) >> ['2'] import re res=re.findall("(?:\d)+yuan","adad7842yuan46gf") print(res) >> ['7842yuan']命名分组

-
|或
import re res=re.findall("www.(oldboy)|(baidu).com","www.oldboy.com") print(res) >> [('oldboy', '')] #优先找括号里的规则,匹配成功返回相对应的值,匹配不成功返回空 import re res=re.findall("www.(oldboy|baidu).com","www.oldboy.com") print(res) >> ['oldboy']
浙公网安备 33010602011771号