常用模块一

time模块和random模块

import time
time.sleep() #让程序执行到这的时候停留一会儿
time.time()  #返回一个以秒位单位的浮点数

表示时间的三种方式:

在python中,通常由三种方式来表示时间:时间戳,元组(struct_time),格式化的时间字符串
①时间戳(timestamp):通常来说,时间戳表示的是从1970年一月一日00:00:00开始按秒计算的偏移量。运行type(time.time())时,返回的时float类型
②格式化的时间字符串(FormatString):“1999-12-06”
③元组(struct_time):struct_time元组共有9个元素:(年月日,时分秒,一年中的第几周,一年中的第几天等)
import time
导入时间模块

 

时间戳
print(time.time())  1552534782.0846364

时间字符串(格式化时间)
print(time.strftime('%Y-%m-%d %H:%M:%S'))year month day hour minute second
#结果:2019-03-14 11:41:53

时间元组:localtime将一个时间戳转化为当前时区的struct——time
print(time.localtime())#结构化时间
#结果:time.struct_time(tm_year=2019, tm_mon=3, tm_mday=14, tm_hour=11, tm_min=56, tm_sec=43, tm_wday=3, tm_yday=73, tm_isdst=0)

 

①时间戳----->结构化时间
t = time.time()
print(time.localtime(t)) 北京时间
print(time.gmtime(t))  格林威治时间

②结构化时间———>时间戳
print(time.mktime(time.localtime()))1552536642.0

③格式化时间 ———>结构化时间[2019-3 ——>tm_year=2019, tm_mon=3,]
print(time.strptime('2018-3-25','%Y-%m-%d'))

④结构化时间————>格式化时间
print(time.strftime('%m/%d/%Y %H:%M:%S',time.localtime()))
03/14/2019 13:37:28

asctime
print(time.asctime())Thu Mar 14 13:39:24 2019
几种格式之间的转换

 

time1 = time.mktime(time.strptime('2017-09-9  10:25:30' ,'%Y-%m-%d %H:%M:%S'))# 结构化时间转化为时间戳
time2 = time.mktime(time.strptime('2017-09-10  11:55:26' ,'%Y-%m-%d %H:%M:%S'))
cha_time = time2 - time1   #两个时间差
final_time = time.gmtime(cha_time)  #把时间戳转化为结构化时间
print(final_time)
print('过去了%d年%d月%d天%d小时%d分钟%d秒'%(final_time.tm_year-1970,
                                                    final_time.tm_mon-1,
                                                    final_time.tm_mday-1,
                                                    final_time.tm_hour,
                                                    final_time.tm_min,
                                                    final_time.tm_sec))
栗子:计算'2017-09-9 10:25:30'与'2017-09-10 11:55:26'的时间差

 

random模块

import random
随机小数
print(random.random())  #大于0且小于1之间的小数
#结果:0.17652598848595968
print(random.uniform(2,3)) #大于2且小于三之间的小数
2.1379289978900364

随机整数
print(random.randint(1,5))#大于1且小于等于5之间的整数
print(random.randrange(1,10,2))#大于等于1且小于10 之间的奇数

随机选择一个返回
print(random.choice(['23',[1,2,3],9]))#返回23 或者 [1,2,3],或者9
#随机选择多个返回,返回的个数为函数的第二个参数
print(random.sample([1,'23',[4,5]],2)) #列表元素任意两个组合

打乱列表顺序
l = [1,3,5,7,8,9]
random.shuffle(l)  #打乱列表顺序
print(l) 结果[3, 7, 8, 1, 9, 5] or [8, 3, 5, 9, 7, 1]

栗子:生成随机验证码
#带字母 A~Z a~z  65 ~91
import random
l = ''
for i in range(6):
    litter = chr(random.randint(65,91))
    number = random.randrange(0,10)
    com = random.choice([litter,number])
    l = ''.join([l,str(com)])
print(l)

import random
l = []
for i in range(6):
    litter = chr(random.randint(65,91))
    number = random.randrange(0,10)
    com = random.choice([litter,str(number)])
    l.append(com)
    ret = ''.join(l)
print(ret)

collections模块

再内置数据类型(list,dict ,set, tuple )的基础上,collections模块还提供了
几个额外的数据类型:counter,deque,defaultdict,namedtuple,OrderedDict

namedtuple:生成可以使用名字来访问元素内容的tuple
deque:双端队列,可以快速的从另外一侧追加和推出对象
counter:计数器,主要用来记数
OrderedDict:有序字典
defaultdict:带有默认值的字典
from collections import namedtuple
Point = namedtuple('point',['x','y','z']) # 'ponit是起的名字'
p = Point(1,2,3)
print(p.x)  #1
print(p.y)  #2
print(p.z)   #3
print(p)    #point(x=1, y=2, z=3)

栗子1:用元组描述一张扑克牌(一张有花色和数字)
Card = namedtuple('card',['suits','number'])
c1 = Card('方块','9')
print(c1)  card(suits='方块', number='9')
print(c1.suits) #方块
print(c1.number)#9

栗子2:用坐标和元的半径表示一个圆
from collections import namedtuple
Circular = namedtuple('circular',['x','y','r'])
namedtuple:生成可以使用名字来访问元素内容的tuple
使用list存储数据时,按索引访问元素很快,但是插入和删除就很慢了,
因为list是线性存储,数据量大的时候,插入和删除效率很低。
deque是为了实现高效率的插入和删除操作的双向列表,适合用于队列和栈

堆栈:先进后出

队列:先进先出   FIFO
import queue
q = queue.Queue()  #创建一个空的队列
队列提供的方法:put get qsize
q.put(10)   #往队列里面放值
q.put(7)
print(q)    #得到内存地址 <queue.Queue object at 0x000002632DE5A9B0>
print(q.qsize())  #可以看这个队列里面有多少个值
print(q.get())   #从队列里面取值,先取10
print(q.get())   #再取7
print(q.get())   #一直在等待,阻塞了
deque:双端队列,可以快速的从另外一侧追加和推出对象
from collections import deque
dq = deque([1,2])
dq.append('a')     #从后面放数据
dq.appendleft('b')# 从前面放数据
dq.insert(1,'@')     #在1的位置插入了一个'@”
print(dq.pop())       #从后面取数据
print(dq.popleft())   # 从前面取数据
双端队列deque 四个方法append appendleft pop popleft
使用字典dict时,key时无序的,在对dict做迭代时,无法确定key的顺序
如果要保持key的顺序,可以使用OrderedDict:
注意OrderedDict的key会按照插入的顺序排列,而不是key本身顺序
from collections import OrderedDict
od = OrderedDict([('a',1),('b',2),('c',3)])
print(od)  #结果时有序的 OrderedDict([('a', 1), ('b', 2), ('c', 3)])
for k in od: # 可以for循环
    print(k)
OrderedDict:有序字典
有如下集合[11,22,33,44,55,66,77,88,99]
将所有大于66的值保存至字典的第一个key中,
将所有小于66 的值保存至第二个key的值中
from collections import defaultdict
values = [11,22,33,44,55,66,77,88,99]
my_dict = defaultdict(list) # 默认所有的values都是list
for value in values:
    if value > 66 :
        my_dict['k1'].append(value)
    else :
        my_dict['k2'].append(value)
print(my_dict)
使用dict时,如 果引用的key不存在,就会KeyError,
如果希望key不存在时,返回一个默认值,就可以用defaultdict
from collections import defaultdict
d = defaultdict(lambda :'Lili')
d['k1'] = 'abd'
print(d)  # key1存在 abd
print(d['k2'])# key2不存在,默认返回Lili
defaultdict:带有默认值的字典

 

from collections import Counter
a = Counter('abdcgkjgsagkL')
print(a)
counter:计数器,主要用来记数,主要计算字符串

os模块

os模块是与操作系统交互的一个接口

'''
os.makedirs('dirname1/dirname2') 可生成多层递归目录 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.rename("oldname","newname") 重命名文件/目录 os.stat('path/filename') 获取文件/目录信息 os.system("bash command") 运行shell命令,直接显示 os.popen("bash command).read() 运行shell命令,获取执行结果 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.path os.path.abspath(path)       返回path规范化的绝对路径 os.path.split(path)           将path分割成目录和文件名二元组返回 os.path.dirname(path)        返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path)      返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path)        如果path存在,返回True;如果path不存在,返回False os.path.isabs(path)          如果path是绝对路径,返回True os.path.isfile(path)        如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path)          如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后访问时间 os.path.getmtime(path)      返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path)        返回path的大小
'''

sys模块

sys模块是与python解释器交互的一个接口
sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version        获取Python解释程序的版本信息
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

 序列化模块

什么叫序列化——将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化

比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?
现在我们能想到的方法就是存在文件里,然后另一个python程序再从文件里读出来。
但是我们都知道,对于文件来说是没有字典这个概念的,所以我们只能将数据转换成字典放到文件中。
你一定会问,将字典转换成一个字符串很简单,就是str(dic)就可以办到了,为什么我们还要学习序列化模块呢?
没错序列化的过程就是从dic 变成str(dic)的过程。现在你可以通过str(dic),将一个名为dic的字典转换成一个字符串,
但是你要怎么把一个字符串转换成字典呢?
聪明的你肯定想到了eval(),如果我们将一个字符串类型的字典str_dic传给eval,就会得到一个返回的字典类型了。
eval()函数十分强大,但是eval是做什么的?e官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。
BUT!强大的函数有代价。安全性是其最大的缺点。
想象一下,如果我们从文件中读出的不是一个数据结构,而是一句"删除文件"类似的破坏性语句,那么后果实在不堪设设想。
而使用eval就要担这个风险。
所以,我们并不推荐用eval方法来进行反序列化操作(将str转换成python中的数据结构)
什么叫序列化

序列化的目的

1、以某种存储形式使自定义对象持久化
2、将对象从一个地方传递到另一个地方。
3、使程序更具维护性。

 

json

Json模块提供了四个功能:dumps、dump、loads、load

 

import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic)  #序列化:将一个字典转换成一个字符串
print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意,json转换完的字符串类型的字典中的字符串是由""表示的

dic2 = json.loads(str_dic)  #反序列化:将一个字符串格式的字典转换成一个字典
#注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
loads和dumps

 

import json
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f)  #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
f.close()

f = open('json_file')
dic2 = json.load(f)  #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f.close()
print(type(dic2),dic2)
load和dump
import json
f = open('file','w')
json.dump({'国籍':'中国'},f)
ret = json.dumps({'国籍':'中国'})
f.write(ret+'\n')
json.dump({'国籍':'美国'},f,ensure_ascii=False)
ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
f.write(ret+'\n')
f.close()
ensure_ascii关键字参数
Serialize obj to a JSON formatted str.(字符串表示的json对象) 
Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key 
ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。) 
If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse). 
If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity). 
indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json 
separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。 
default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError. 
sort_keys:将数据根据keys的值进行排序。 
To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used.
其他参数说明
import json
data = {'username':['李华','二愣子'],'sex':'male','age':16}
json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
print(json_dic2)
json的格式化输出

pickle

json & pickle 模块

用于序列化的两个模块

 

  • json,用于字符串 和 python数据类型间进行转换
  • pickle,用于python特有的类型 和 python的数据类型间进行转换

 

pickle模块提供了四个功能:dumps、dump(序列化,存)、loads(反序列化,读)、load  (不仅可以序列化字典,列表...可以把python中任意的数据类型序列化

import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic)  #一串二进制内容

dic2 = pickle.loads(str_dic)
print(dic2)    #字典

import time
struct_time  = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close()

f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year)
pickle

既然pickle如此强大,为什么还要学json呢?
这里要说明一下,json是一种所有的语言都可以识别的数据结构。
如果我们将一个字典或者序列化成了一个json存在文件里,那么java代码或者js代码也可以拿来用。
但是如果我们用pickle进行序列化,其他语言就不能读懂这是什么了~
所以,如果序列化的内容是列表或者字典,非常推荐使用json模块
但如果出于某种原因你不得不序列化其他的数据类型,而未来还会用python对这个数据进行反序列化的话,那么就可以使用pickle

 

posted @ 2019-03-14 18:39  红领巾***  阅读(127)  评论(0编辑  收藏  举报