hashlib加密模块、logging模块






hashlib加密模块
什么是加密:
将明文(人看的懂)数据通过一些手段变成密文数据(人看不懂),密文数据的表现形式一般都是一串没有规则的字符串
加密算法
加密算法有很多种>>>(将明文变密文的内部规则)
算法的难易程度可以根据产生密文的长短来判断
越长意味着算法越复杂
特点:
不可逆:无法根据散列值来还原原来的数据
定长输出:无论输入的原始数据有多长,结果长度是相同的。
抗修改性:输入的微小改变哪怕只有一个字符不同,会引起结果的巨大改变。
强碰撞性:基本上不可能找到两个不同的数据,产生相同的hash值.
什么时候使用加密
涉及到隐私数据的时候,应该考虑使用加密
最为常见的就是对用户的密码加密,防止密码泄露
基本使用
# hash.update(arg
'''
更新hash对象。连续的调用该方法相当于连续的追加更新。例如m.update(a); m.update(b)相当于m.update(a+b)。注意,当数据规模较大的时候,Python的GIL在此时会解锁,用于提高计算速度。
一定要理解update()的作用,由于消息摘要是只针对当前状态产生的,所以每一次update后,再次计算hexdigest()的值都会不一样。
'''
import hashlib # 引用hashlib模块
md5 = hashlib.md5() # 指定算法>>md5算法
md5.update(b'tuzi') # 只能接受bytes类型
res = md5.hexdigest() # 获取加密之后的密文数据
print(res) # e11ce15ad01f5fef87016b607ea74a1b
# 在传入数据的时候 只要内容一致 那么算法的结果肯定一致
加密补充
# 加密之后的结果是无法直接反解密的
# 所谓的反解密其实是暴力破解>>>:反复的猜
'''
很多用户喜欢用123456,abcdef,loveyou这些简单的口令,由于MD5、SHA1等所有摘要算法都是公开的,黑客可以事先通过这些算法计算出这些常用口令的摘要值,得到一个反推表:
08b9239f92786f609443b669d5a041c1 : 123456
960d15c50def228e8557d68945b5f7c0 : abcdef
47c0e829611b55cd05c680859adb8863 :loveyou
'''
加盐处理
# 增加破解的难度
# 额外给原始数据添加一点自定义的数据,使得生成的消息摘要不同于普通方式计算的摘要。
加盐处理使用
import hashlib # 引用hashlib模块
md5 = hashlib.md5() # 指定
# 算法>>md5算法
# 加盐处理(添加一些额外的干扰项)
md5.update('阿巴阿巴'.encode('utf8'))
md5.update(b'tuzi')
print(md5.hexdigest()) # 8c00f66f360fbdfee2cbe92e4edda15c
动态加盐
干扰项动态变化
可以是用户名的一部分,也可以是当前时间...
动态加盐使用
# 直接加密
import hashlib
md5 = hashlib.md5()
md5.update(b'tuzi')
res = md5.hexdigest()
print(res)
# 动态加盐
s = 'tuzi'
ret = hashlib.md5()
ret.update(s[::-2].encode('utf-8'))
ret.update(s.encode('utf-8'))
# 直接加密的返回结果
# e11ce15ad01f5fef87016b607ea74a1b
# 动态加盐(部分用户名字)的返回结果
# 213498795290ab0cb9b5b2b49a969935
加密应用场景
密码加密如何比对
用户输入的还是明文但是到了程序里面之后会采用相同的加密算法变成密文
之后拿着密文与跟数据库里面的密文比对,如果一致就是密码正确,不一致就是错误
文件内容一致性校验
"""
作为软件的提供者,我们在提供安全软件的同时会对给该软件内容做加密处理得到一个该安全软件独有的密文
用户在下载软件之后也会对内容做相同的加密之后比对两次密文是否一致
如果是表示中途没有被修改,如果不是表示中途被修改过可能存在病毒
"""
# 针对大文件一致性校验的优化策略
# 如果一个文件有10G 那么如果全部读取并加密速度太慢
# 这个时候可以考虑对文件内容进行切片读取并加密的操作
logging模块
'''日志模块就是在程序的各个环境记录便于后续的查看'''
日志等级
# 日志按照重要程度分为五个级别:默认只有达到warning警告级别及以上才会记录日志
import logging
logging.debug('debug message') # 10
logging.info('info message') # 20
logging.warning('warning message') # 30
logging.error('error message') # 40
logging.critical('critical message') # 50
基本参数
logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有:
filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。
format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息
基本使用
import logging
file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8', )
# 所有的格式不需要记忆 后续几乎都是拷贝加修改
logging.basicConfig(
format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
handlers=[file_handler, ],
level=logging.ERROR
)
logging.error('阿巴阿巴阿巴')
日志模块的主要组成部分
import logging
# 1.logger对象:产生日志(无包装产品)
logger = logging.getLogger('转账记录')
# 2.filter对象:过滤日志(剔除不良品)
# 针对过滤功能完全可以不看,因为handler自带了基本的过滤操作
# 3.handler对象:控制日志的输出位置(文件\终端...)
# (产品分类)
hd1 = logging.FileHandler('a1.log',encoding='utf-8') # 输出到文件中
hd2 = logging.FileHandler('a2.log',encoding='utf-8') # 输出到文件中
hd3 = logging.StreamHandler() # 输出到终端
# 4.format对象:控制日志的格式(包装)
fm1 = logging.Formatter(
fmt='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
)
fm2 = logging.Formatter(
fmt='%(asctime)s - %(name)s: %(message)s',
datefmt='%Y-%m-%d',
logger.addHandler(hd1)
# 6.logger.addHandler(hd2)
logger.addHandler(hd3)
hd1.setFormatter(fm1)
hd2.setFormatter(fm2)
hd3.setFormatter(fm1)
# 7.设置日志等级
logger.setLevel(10) # debug
# 8.记录日志
logger.debug('我有一个的大胆的想法')
日志模块配置字典
'''有一套提前写好的主体,CV后修改即可'''
import logging
import logging.config
# 定义日志输出格式 开始
standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \
'[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字
simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'
# 定义日志输出格式 结束
# 自定义文件路径
logfile_path = 'a3.log'
# logfile_path1 = 'a1.log'
# log配置字典
LOGGING_DIC = {
'version': 1,
'disable_existing_loggers': False,
'formatters': {
'standard': {
'format': standard_format
},
'simple': {
'format': simple_format
},
},
'filters': {}, # 过滤日志
'handlers': {
#打印到终端的日志
'console': {
'level': 'DEBUG',
'class': 'logging.StreamHandler', # 打印到屏幕
'formatter': 'simple'
},
#打印到文件的日志,收集info及以上的日志
'default': {
'level': 'DEBUG',
'class': 'logging.handlers.RotatingFileHandler', # 保存到文件
'formatter': 'standard',
'filename': logfile_path, # 日志文件
'maxBytes': 1024*1024*5, # 日志大小 5M
'backupCount': 5,
'encoding': 'utf-8', # 日志文件的编码,再也不用担心中文log乱码了
},
},
'loggers': {
#logging.getLogger(__name__)拿到的logger配置
'': {
'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕
'level': 'DEBUG',
'propagate': True, # 向上(更高level的logger)传递
}, # 当键不存在的情况下 (key设为空字符串)默认都会使用该k:v配置
},
}
# 使用日志字典配置
# logging.config.dictConfig(LOGGING_DIC) # 自动加载字典中的配置
# logger1 = logging.getLogger('转账记录')
# logger2 = logging.getLogger('注册记录')
# logger1.debug('好好的 不要浮躁 努力就有收获')
# logger2.warning('尊敬的VIP客户 晚上好 您又来啦')
logging.config.dictConfig(LOGGING_DIC) # 自动加载字典中的配置
logger1 = logging.getLogger('红浪漫顾客消费记录')
'''loggers配置中使用空字符串作为字典的键 兼容性最好!!!'''
logger1.debug('大胆的想法实现了')
配置字典如何在项目中使用
# 按照字典数据应该放在哪个py文件内
日志字典数据是日志模块固定的配置,写完一次之后几乎都不需要动它属于配置文件
"""配置文件中变量名推荐全大写"""
def get_logger(msg):
# 记录日志
logging.config.dictConfig(settings.LOFFING_DIC) # 自动加载字典中的配置
logger1 = logging.getLogger(msg)
return logger1
第三方模块
如何利用工具
需要使用python解释器提供的pip工具
pip的路径在python解释器文件夹内的scripts目录下
'''
如果下载终端中直接使用目录则需要添加环境变量
如python解释器的路径:F:\python36
pip工具的路径:F:\python36\scripts
将此路径下的pip文件添加到环境变量里面就可以了
为了区分版本会人为的将
python3的pip工具写成pip3
python2的pip工具写成pip
'''
如何查看当前解释器下载的第三方模块(通常都是借助于编辑器查看)
'''以pychorm为例'''
file ---> settings ---> project ---> python interprter
在这里会列举出所有的第三方模块,纯净的解释器默认只有两个
pip
setuptools
如何下载第三方模块
方式1:直接使用命令行
pip3 install 模块名 '''该方式默认下载的是最新版本'''
pip3 install 模块名==版本号 # 自定义下载版本号
🐖:pip工具默认是从国外的仓库下载模块,速度会比较慢,可以修改
pip3 install 模块名 -i 仓库地址 # 命令行临时修改地址
'''
针对仓库的地址可以直接百度pip源即可
1)阿里云 http://mirrors.aliyun.com/pypi/simple/
2)豆瓣 http://pypi.douban.com/simple/
3)清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
4)中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/
5)华中科技大学 http://pypi.hustunique.com/
'''
方式2:利用编程软件提供的快捷方法
还是刚才在pycharm查看第三方模块的界面
file ---> settings ---> project ---> python interprter
双击任意一个模块名称或者左下角加号按钮
在搜索框中输入你想要下载的模块即可
并且可以在左侧勾选specify version选择版本
pycharm可以也可以换源
左下方点击manage repositoires管理地址即可
"""
在下载第三方模块的时候可能会报错
1.报错信息中含有timeout关键字
原因是你当前计算机的网络不稳定 重新执行多次或者切换网络
2.报错信息中没有太多的关键字 并且很长
拷贝最后一行错误信息 去百度
格式: pip3下载模块名报错错误信息
"""
第三方模块之openpyxl模块
"""以后会接触到很多第三方模块 那么统一的学习策略其实就是看文档"""
# 将文档中的代码拷贝执行查看效果从而推到功能
使用上述两个方法都可以下载openpyxl模块
"""
excel文件的版本及后缀
2003版本之前 excel的文件后缀是xls
2003版本之后 excel的文件后缀是xlsx、csv
在python中能够处理excel文件的模块有很多 其中最出名的有
xlrd、xlwt分别控制excel文件的读写 能够兼容所有版本的文件
openpyxl针对03版本之前的兼容性可能不好 但是功能更加强大
"""
openpyxl模块使用
create_sheet # 创建工作簿
title('工作簿名') # 改工作簿名字
save('文件名.xlsx') # 保存excel文件
from openpyxl import Workbook
wb = Workbook()
wb1 = wb.create_sheet('名单1') # 创建工作簿
wb2 = wb.create_sheet('名单2') # 创建工作簿
wb3 = wb.create_sheet('名单3') # 创建工作簿
wb4 = wb.create_sheet('名单4') # 创建工作簿
wb1.title = '123' # 改工作簿名字
wb.save('111.xlsx') # 保存excel文件
# 如何写数据
openpyxl如何写数据
# 批量写普通数据
wb1.append(['id','username','password'])
# 写普通数据的方式1
wb1['D4'] = 777 # D4单元格写入777
# 写普通数据方式2
wb1.cell(row=3,column=4,value=999) # 第三行第四列写入999
# 写公式数据(也可以在python代码中处理完毕以普通数据写入)
wb1['D5'] = '=sum(D3:D4)' # 计算两个单元格的和
wb.save('111.xlsx')
openpyxl如何读数据
from openpyxl import load_workbook
wb = load_workbook('111.xlsx',read_only=True,data_only=True)
print(wb.sheetnames) # 获取111.xlsx中所有的工作簿名称,结果是数据列表类型
# ['Sheet', '123', '名单2', '名单3', '名单4']
wb1 = wb['123'] # 拿到工作簿test对象
print(wb1['A1'].value) # id
print(wb1['D5'].value) # None 获取用函数统计的数据,发生无法取到值
"""
第一需要加一个参数
第二需要人为的先去修改一下用程序产生的excel表格(不可能用程序产生excel文件之后又直接再用程序去读入,这样没有任何实际意义 通常用程序创建好表格后给人看,人讲自己修改的表格再交由程序处理)
"""
print(wb1.cell(row = 3,column = 4).value) # 999 第二种取值方式
# 获取一行行的数据
for row in wb1.rows: # 拿到每一行的数据
for data in row: # 拿到一行行数据里面每一个单元格的数据
print(data.value)
# 获取一列列的数据(如果想获取 必须把readonly去掉)
for column in wb1.columns: # 拿到每一列的数据
for r in column: # 拿到一列列数据里面每一个单元格的数据
print(r.value)
# 获取最大的行数和列数
print(wb1.max_row)
print(wb1.max_column)

浙公网安备 33010602011771号