/* 看板娘 */ /* 粒子吸附*/

hashlib模块

算法介绍

Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。

什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。

摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。

摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。

我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值

import hashlib
 
md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?')
print md5.hexdigest()

计算结果如下:
d26a53750bc40b38b65a520292f69306

如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

md5 = hashlib.md5()
md5.update('how to use md5 in ')
md5.update('python hashlib?')
print md5.hexdigest()

MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

 

import hashlib
 
sha1 = hashlib.sha1()
sha1.update('how to use sha1 in ')
sha1.update('python hashlib?')
print sha1.hexdigest()

SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。

 

hashlib模块

加密:将明文数据通过一系列算法变成密文数据(目的就是为了数据的安全)

加密算法:md系列 sha系列 base系列 hmac系列

# 基本使用
import hashlib


# 1.先确定算法类型(md5普遍使用)
md5 = hashlib.md5()
# 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# md5.update('123'.encode('utf8'))
md5.update(b'123')
# 3.获取加密之后的密文数据(没有规则的一串随机字符串)
res = md5.hexdigest()
print(res)
"""
1.加密之后的密文数据是没有办法反解密成明文数据的
市面上所谓的破解 其实就是提前算出一系列明文对应的密文
之后比对密文再获取明文
"""

详细操作

# import hashlib
#
#
# # 1.先确定算法类型(md5普遍使用)
# md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # md5.update('123'.encode('utf8'))
# md5.update(b'123')
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
# res = md5.hexdigest()
# print(res)
"""
1.加密之后的密文数据是没有办法反解密成明文数据的
    市面上所谓的破解 其实就是提前算出一系列明文对应的密文
    之后比对密文再获取明文
"""

# 1.明文数据只要是相同的 那么无论如何传递加密结果肯定是一样的
# import hashlib
# # 1.先确定算法类型(md5普遍使用)
# md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # md5.update('123'.encode('utf8'))
# # md5.update(b'hellojason123')
# md5.update(b'hello')
# md5.update(b'jason')
# md5.update(b'123')  # 4bd388611b31c548eedef14b16c9868c
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
# res = md5.hexdigest()
# print(res)  # 4bd388611b31c548eedef14b16c9868c


# 2.密文数据越长表示内部对应的算法越复杂 越难被正向破解
# import hashlib
# # 1.先确定算法类型(md5普遍使用)
# md5 = hashlib.sha256()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # md5.update('123'.encode('utf8'))
# # md5.update(b'hellojason123')
# md5.update(b'hello')
# md5.update(b'jason')
# md5.update(b'123')  # 6ec0f865ec4e9bcf9abc7f6c0e7268acfb2ba36f3e460fd592a214f7eacc92b0
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
# res = md5.hexdigest()
# print(res)  # 6ec0f865ec4e9bcf9abc7f6c0e7268acfb2ba36f3e460fd592a214f7eacc92b0
"""
密文越长表示算法越复杂 对应的破解算法的难度越高
但是越复杂的算法所需要消耗的资源也就越多 密文越长基于网络发送需要占据的数据也就越大
    具体使用什么算法取决于项目的要求 一般情况下md5足够了
"""

# 3.涉及到用户密码存储 其实都是密文 只要用户自己知道明文是什么
"""
    1.内部程序员无法得知明文数据
    2.数据泄露也无法得知明文数据
ATM购物车练习 用户密码采取的就是密文存取
"""

# 4.加盐处理
"""
在对明文数据做加密处理过程前添加一些干扰项
"""
# import hashlib
# # 1.先确定算法类型(md5普遍使用)
# md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # md5.update('123'.encode('utf8'))
# # 加盐(干扰项)
# md5.update('公司内部自己定义的盐'.encode('utf8'))
# # 真实数据
# md5.update(b'hellojason123')
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
# res = md5.hexdigest()
# print(res)  # 4326fe1839d7c4186900eb2b356d4f8a


# 5.动态加盐
"""
在对明文数据做加密处理过程前添加一些变化的干扰项
"""
# import hashlib
# # 1.先确定算法类型(md5普遍使用)
# md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # md5.update('123'.encode('utf8'))
# # 加盐(干扰项)
# # md5.update('公司内部自己定义的盐'.encode('utf8'))
# # 动态加盐(干扰项)  当前时间 用户名的部分 uuid(随机字符串(永远不会重复))
# import time
# res1 = str(time.time())
# md5.update(res1.encode('utf8'))
# # 真实数据
# md5.update(b'hellojason123')
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
# res = md5.hexdigest()
# print(res)  # 4326fe1839d7c4186900eb2b356d4f8a

"""
在IT互联网领域 没有绝对的安全可言 只有更安全
    原因在于互联网的本质 就是通过网线(网卡)连接计算机
"""


# 6.校验文件一致性
"""
文件不是很大的情况下 可以将所有文件内部全部加密处理
但是如果文件特别大 全部加密处理相当的耗时好资源 如何解决???
    针对大文件可以使用切片读取的方式 
"""
# import hashlib
# md5 = hashlib.md5()
# with open(r'a.txt','rb') as f:
#     for line in f:
#         md5.update(line)
# real_data = md5.hexdigest()
# print(real_data)  # 29d8ea41c610ee5d1e76dd0a42c7e60a

# with open(r'a.txt','rb') as f:
#     for line in f:
#         md5.update(line)
# error_data = md5.hexdigest()
# print(error_data)  # 738a56b49f24884ba758d1e4ab6ceb74
# import os
# # 读取文件总大小
# res = os.path.getsize(r'a.txt')
# # 指定分片读取策略(读几段 每段几个字节)  10   f.seek()
# read_method = [0,res//4,res//2,res]

"""
比特流技术
断点续传技术
"""

logging日志模块

知识点很多 但是需要掌握的很少(会用即可)

import logging


# 日志有五个等级(从上往下重要程度不一样)
# logging.debug('debug级别') # 10
# logging.info('info级别') # 20
# logging.warning('warning级别') # 30
# logging.error('error级别') # 40
# logging.critical('critical级别') # 50
'''默认记录的级别在30及以上'''

# 简单使用
import logging
file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8',)
logging.basicConfig(
format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
handlers=[file_handler,],
level=logging.ERROR
)
logging.error('日志模块很好学 不要自己吓自己')
"""
1.如何控制日志输入的位置
想在文件和终端中同时打印
2.不同位置如何做到不同的日志格式
文件详细一些 终端简单一些
"""

日志模块详细介绍

import logging


# 1.logger对象:负责产生日志
logger = logging.getLogger('转账记录')
# 2.filter对象:负责过滤日志(直接忽略)
# 3.handler对象:负责日志产生的位置
hd1 = logging.FileHandler('a1.log',encoding='utf8')  # 产生到文件的
hd2 = logging.FileHandler('a2.log',encoding='utf8')  # 产生到文件的
hd3 = logging.StreamHandler()  # 产生在终端的
# 4.formatter对象:负责日志的格式
fm1 = logging.Formatter(
    fmt='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S %p',
)
fm2 = logging.Formatter(
    fmt='%(asctime)s - %(name)s %(message)s',
    datefmt='%Y-%m-%d',
)
# 5.绑定handler对象
logger.addHandler(hd1)
logger.addHandler(hd2)
logger.addHandler(hd3)
# 6.绑定formatter对象
hd1.setFormatter(fm1)
hd2.setFormatter(fm2)
hd3.setFormatter(fm1)
# 7.设置日志等级
logger.setLevel(30)
# 8

配置字典

# 核心就在于CV
import logging
import logging.config

standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \
'[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字

simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'

logfile_path = 'a3.log'
# log配置字典
LOGGING_DIC = {
'version': 1,
'disable_existing_loggers': False,
'formatters': {
'standard': {
'format': standard_format
},
'simple': {
'format': simple_format
},
},
'filters': {}, # 过滤日志
'handlers': {
#打印到终端的日志
'console': {
'level': 'DEBUG',
'class': 'logging.StreamHandler', # 打印到屏幕
'formatter': 'simple'
},
#打印到文件的日志,收集info及以上的日志
'default': {
'level': 'DEBUG',
'class': 'logging.handlers.RotatingFileHandler', # 保存到文件
'formatter': 'standard',
'filename': logfile_path, # 日志文件
'maxBytes': 1024*1024*5, # 日志大小 5M
'backupCount': 5,
'encoding': 'utf-8', # 日志文件的编码,再也不用担心中文log乱码了
},
},
'loggers': {
#logging.getLogger(__name__)拿到的logger配置 空字符串作为键 能够兼容所有的日志
'': {
'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕
'level': 'DEBUG',
'propagate': True, # 向上(更高level的logger)传递
}, # 当键不存在的情况下 (key设为空字符串)默认都会使用该k:v配置
},
}


# 使用配置字典
logging.config.dictConfig(LOGGING_DIC) # 自动加载字典中的配置
logger1 = logging.getLogger('xxx')
logger1.debug('好好的 不要浮躁 努力就有收获')

 

第三方模块

# 并不是python自带的 需要基于网络下载!!!

'''pip所在的路径添加环境变量'''
下载第三方模块的方式
    方式1:命令行借助于pip工具
        pip3 install 模块名  # 不知道版本默认是最新版
        pip3 install 模块名==版本号  # 指定版本下载
        pip3 install 模块名 -i 仓库地址  # 临时切换
        '''命令行形式永久修改需要修改python解释器源文件'''
    方式2:pycharm快捷方式
        settings 
            project 
                project interprter
                    双击或者加号
        点击右下方manage管理添加源地址即可
# 下载完第三方模块之后 还是使用import或from import句式导入使用
"""
pip命令默认下载的渠道是国外的python官网(有时候会非常的慢)
我们可以切换下载的源(仓库)
    (1)阿里云 http://mirrors.aliyun.com/pypi/simple/2)豆瓣 http://pypi.douban.com/simple/3)清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/4)中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/5)华中科技大学http://pypi.hustunique.com/
  
pip3 install openpyxl -i http://mirrors.aliyun.com/pypi/simple/
"""


"""
下载第三方模块可能报错的情况及解决措施
    1.报错的提示信息中含有关键字timeout
        原因:网络不稳定
        措施:再次尝试 或者切换更加稳定的网络
    2.找不到pip命令
        环境变量问题
    3.没有任何的关键字 不同的模块报不同的错
        原因:模块需要特定的计算机环境
        措施:拷贝报错信息 打开浏览器 百度搜索即可
            pip下载某个模块报错错误信息
"""

 

posted @ 2021-11-29 20:00  红绿灯的黄呀  阅读(68)  评论(0)    收藏  举报