python模块之_正则 re_configparser_logging_hashlib

正则表达式的内容放在最下面了 

configparser 模块:

#!/usr/bin/env python
# coding:utf-8

import configparser

# 专门用于操作配置文件的模块

# config = configparser.ConfigParser() # 实例化对象
#
# config["DEFAULT"] = {'ServerAliveInterval': '45',
#                      'Compression': 'yes',
#                      'CompressionLevel': '9'}
#
# config['bitbucket.org'] = {}
# config['bitbucket.org']['User'] = 'hg'
#
# config['topsecret.server.com'] = {}
# ts = config['topsecret.server.com']
# ts['Host Port'] = '50022'  # mutates the parser
# ts['ForwardX11'] = 'no'  # same here
#
# config['DEFAULT']['ForwardX11'] = 'yes'
#
# with open('example.ini', 'w') as configfile:
#     config.write(configfile)


config = configparser.ConfigParser()

print(config.sections())
config.read('example.ini')  # 读取配置文件
print(config.sections())  # ['bitbucket.org', 'topsecret.server.com']

print('DEFAULT' in config)  # 判断是否有键

print(config['DEFAULT']['FORwardx11'])  ## 块下的子键不区分大小写
print(config['bitbucket.org']['User'])

# DEFAULT 块比较特殊,会在 for 遍历时一起出来
# DEFAULT 作用是给所有的块都能共用
for i in config['bitbucket.org']:
    print(i)

print(config.options('bitbucket.org'))  # 拿到键
print(config.items('bitbucket.org'))  # 拿到键值对的元组

print(config.get('bitbucket.org', 'compression'))  # 取bitbucket.org下的某值,DEFAULT下的值也算。

config.add_section("address")  # 加个区块
config.set("address", 'city', 'suzhou')  # 增加行

config.remove_section("topsecret.server.com")  # 删除块
config.remove_option("DEFAULT", "ForwardX11")  # 删除行

config.write(open("conf.cfg", 'w'))  # 写入文件

 

logging 模块:
#!/usr/bin/env python
# coding:utf-8

import logging

## 日志操作模块
# -------------------------------logging.basicConfig 方式
# logging.basicConfig(
#     level=logging.DEBUG,  # 改变了默认级别
#     filename = "loggingtest.log",  ## 写入文件
#     filemode="a",  # a 追加模式  w 覆盖
#     format="%(asctime)s %(filename)s[%(lineno)s] %(message)s",  # 写入时间   输出message时的行号   内容
# )
#
# ## 参考 https://www.cnblogs.com/yuanchenqi/articles/5732581.html
#
# logging.debug('debug...')
# logging.info('info...')
# logging.warning('warning...')  # 默认只显示此级往下
# logging.error('error.....')
# logging.critical('critical......')



# -------------------------------logger 对象方式
def logger():
    logger = logging.getLogger()
    logger.setLevel("DEBUG")

    fh =logging.FileHandler("logtest.log") #输出文件
    ch = logging.StreamHandler() #输出屏幕

    fm = logging.Formatter("%(asctime)s %(filename)s[%(lineno)s] %(message)s")

    fh.setFormatter(fm)
    ch.setFormatter(fm)

    logger.addHandler(fh)
    logger.addHandler(ch)
    return logger

logger = logger()

logger.debug("debug...")
logger.info("info...")
logger.warning("warning...")
logger.error("error...")
logger.critical("critical...")



# logger = logging.getLogger("logger")  ##根对象
# logger1 = logging.getLogger("logger1")
# logger2 = logging.getLogger("logger1.sontree") ## 子对象
## 如果子级和父级都有输出动作,那么子级的输出动作会输出2次
## 解决方法是取消父级的输出动作,只输出子级。

 

hashlib

import hashlib

## 普通的加密,存在撞库的危险
obj_a = hashlib.md5()
obj_a.update("hello".encode("utf8"))  # 5d41402abc4b2a76b9719d911017c592
print(obj_a.hexdigest())

obj_a.update("root".encode("utf8"))
print(obj_a.hexdigest()) #  e206121dbbe984f3bc6c6448846ed8cd 这一串实际上是基于前一次的原始字符之上的加密结果。

# obj_a.update("helloroot".encode("utf8"))  # e206121dbbe984f3bc6c6448846ed8cd 等于helloroot
# print(obj_a.hexdigest())

## 加盐的加密,降低撞库的风险
# obj_b = hashlib.md5() # 5d41402abc4b2a76b9719d911017c592
obj_b = hashlib.md5('1qaz@WSX'.encode('utf8'))
obj_b.update("hello".encode("utf8")) # 042cd0078e14743b5da893388d095859

print(obj_b.hexdigest())

 

re模块:

#!/usr/bin/env python
# coding:utf-8

## 正则表达式,作用就是做模糊匹配, 快速匹配
## 参考 https://www.cnblogs.com/yuanchenqi/articles/5732581.html

import re

lis = re.findall('\d+',"alex22jack33ran8sdsff100")
print(lis)

## 元字符  . ^ $ * + ? {} [] | () \

# 点 . 是通配符 可以代替除了 \n 外的任意一个字符
print(re.findall("a..x","absxdfsasdxkklarsx"))

# 尖角号 ^ 匹配只能以其开头的。
print(re.findall("^a..x","absxdfsasdxkklarsx"))

# 刀勒 $ 匹配只能以其结尾的。
print(re.findall("a..x$","absxdfsasdxkklarsx"))


# 星 * 匹配的是0到无穷次, 加 + 匹配的是1到无穷次
# 贪婪匹配
print(re.findall("alex*","absxdfsalexxxdds"))
print(re.findall("alex+","absxdfsalexxxdds"))
print(re.findall("alex*","absxdfsaledds"))
print(re.findall("alex+","absxdfsaledds"))

# 问号 ? 匹配 1次或0次
print(re.findall("alex?","alebsxdfsalexxxdds"))

'''
大括号{} 可以灵活运用  
{0,} == *
{1,} == +
{0,1} == ?
{1,5} 必须至少1个,最多取到5个
{5} 必须至少5位才能匹配
'''
print(re.findall("alex{2}","alexbsxdfsalexxxxdds"))
print(re.findall("alex{1,3}","alexbsxdfsalexxxxdds"))

print(re.findall("alex*?","alexbsxdfsalexxxxdds")) # 后面加问号,变成惰性匹配


# 最重要的字符集 []  方括号里面是字符集,特殊符号 * + ? 不再特殊,而 - 表示连续
print(re.findall("a[bc]","abexbsxdfsacexxxaxdds"))  # ab  ac
print(re.findall("a[bc]x","abexbsxdfsacxexxxaxdds"))  # acx
print(re.findall("a[b*]x","abexbsxdfsacxexxxa*xdds"))  # a*x

print(re.findall("a[a-z]","abexbsxdfsacxexxxa*xdds"))  # ab  ac
print(re.findall("a[a-z]*","abe,xbsxdfsacxexxxa*xdds"))  # abe  acxexxxa

print(re.findall("a[0-9]","ab8a7654cde"))  # a7
print(re.findall("a[0-9]*","ab8a7654cde"))  # a   a7654

print(re.findall("a[^0-9]","ab8a7654cde"))  # 逻辑非:不要0-9

print(re.findall("\([^()]*\)","12+(34*5+3-7*(3-1))"))  # 得到 (3-1)
print(re.findall("34\*5","12+(34*5+3-7*(3-1))"))  # 星号被转义

'''
元字符之转义符\
反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等
'''

print(re.findall("\d","12+(34*5+3-7*(3-1))"))
print(re.findall(r"I\b","Hello I am LI LIST"))
print(re.findall(r"I\\c","Hello I am LI LI\cST"))  ## 解释器会识别一次, re也会识别一次。所以要多加一个\

print(re.findall(r"ka|bc","Hellbcoaskads"))  ## bc  ka

print(re.findall("(abc)","abcabcabckkkabc"))  # 得到四个abc
print(re.findall("(abc)+","abcabcabckkkabc"))  # 仅输出分组里的第一个
print(re.findall("(?:abc)+","abcabcabckkkabc"))  # 取消分组优先级

'''
re.findall是找到所有的,返回list, re.search是只找一个, 返回对象
'''
print("-------------------------------------")
print(re.search("\d+","asdf321kdfas23"))
print(re.search("\d{5}","asdf321kdfas23"))
print(re.search("\d+","asdf321kdfas23").group())  # group方法取得结果

print(re.search("(abc)","abcabcabc"))
print(re.search("(?P<name>[a-z]+)\d+","alex36wusir34xialv33")) ## 分组,组名name
print(re.search("(?P<name>[a-z]+)\d+","alex36wusir34xialv33").group("name"))  # alex
print(re.search("(?P<name>[a-z]+)(?P<age>\d+)","alex36wusir34xialv33").group("age"))  # 36


print(re.match("\d+","666alex36wusir34xialv33"))##只在开头匹配,返回对象
print(re.match("\d+","666alex36wusir34xialv33").group())  ## 666


print(re.split(" ","hello abc def")) # 按空格分开
print(re.split("[ |]","hello abc|def")) # 按空格或竖线分开
print(re.split("[ab]","aassfabcde")) # 按a或b分开
print(re.split("ab","aassfabcde")) # 按 ab 分开


print(re.sub("\d+","*","asdf23asdfs88223asdfg")) # 数字被替换成*
print(re.sub("\d","*","asdf23asdfs88223asdfg",5)) # 单个数字被替换成* 只替换5次

print(re.subn("\d+","*","asdf23asdfs88223asdfg")) # 返回元组(结果,次数)


com = re.compile("\d+")  # 赋值到变量,方便使用。
print(com.findall("asdf4123ghjkoo899dddsa"))


ret = re.finditer("\d","fasdf765rqwrq3wcascsc32dfasdf") ##返回一个迭代器对象
print(next(ret).group())  # 拿到迭代器中第一个
print(next(ret))


print(re.findall("www\.(baidu|163)\.com","http://www.baidu.com/index.html")) # 只能拿到 baidu  因为默认有分组,优先返回分组
print(re.findall("www\.(baidu|163)\.com","http://www.163.com/index.html")) # 只能拿到 163 因为默认有分组,优先返回分组
print(re.findall("www\.(?:baidu|163)\.com","http://www.baidu.com/index.html")) # www.baidu.com  因为加了去优先级 ?:

 

正则表达式补充: findall 和 split 遇到了括号(分组)时,有特殊处理。

# ret = re.findall('www.(baidu|oldboy).com', 'www.oldboy.com')
# print(ret)  # ['oldboy']  
# 这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可

# 取消分组优先, ?:
ret = re.findall('www.(?:baidu|oldboy).com', 'www.oldboy.com')
print(ret)  # ['www.oldboy.com']


# ret = re.split("(\d+)", "eva3egon4yuan")
# print(ret)  # 结果 : ['eva', '3', 'egon', '4', 'yuan']

ret = re.split("\d+", "eva3egon4yuan")
print(ret)  # 结果 : ['eva', 'egon', 'yuan']

 

import re
# 身份证号码
ret = re.search('^[1-9](\d{14})(\d{2}[0-9x])?$', '110105199912122277')
print(ret.group())
print(ret.group(1)) # 拿到第一个括号内
print(ret.group(2)) # 拿到第二个括号内



# 手机号码
phone_number = input('please input your phone number : ')
if re.match('^(13|14|15|17|18)[0-9]{9}$',phone_number):
        print('合法的手机号码')
else:
        print('不是合法的手机号码')

 

更多的正则内容可参考 Eva Jin的博客  https://www.cnblogs.com/Eva-J/articles/7228075.html

posted @ 2018-05-30 19:32  枫若雪  阅读(238)  评论(0编辑  收藏  举报