python基础-匿名函数、内置函数、正则表达式、模块

1. 匿名函数

1.1 有名函数

　　有名函数：定义了一个函数名，函数名指向内存地址；通过函数名进行访问。函数名加括号就可以运行有名函数，例如：func()

def func(x, y, z = 1):
    return x + y + z
print(func(1,5,2))

1.2 匿名函数

　　匿名函数：没有名字的函数，定义的时候不需要函数名；定义匿名函数的关键字是：lambda

　　特点：

　　　　1.没有函数名

　　　　2.函数自带return

　　应用场景：

　　　　1.应用于一次性的地方

　　　　2.临时使用

salaries={
'egon':3000,
'alex':100000000,
'wupeiqi':10000,
'yuanhao':2000
}
# 打印工资最高的人名，利用匿名函数很好的解决此问题
print(max(salaries,key=lambda name:salaries[name]))

2. 内置函数

　　官方内置函数网址：https://docs.python.org/3/library/functions.html

2.1 概览

2.2 abs all any

　　1.abs 求绝对值

　　2.all 可迭代对象取出所有值，进行判断，所有为真就返回True

　　　　如果可迭代对象为空，返回True 例如：all([])

　　3.any

　　　　可迭代对象取出所有值，进行判断，任何一个为真就返回True

　　　　如果可迭代对象为空，返回False 例如：any([])

print(abs(-100))
print(all([1,-20,None])) # 只要有一个为假，返回False
print(all([1,-20,"a"]))  # 只要所有为真，返回True
print(all([]))            # 可迭代对象为空，返回True

print(any([1,-20,None])) # 只要有一个为真，返回True
print(any([]))           # 可迭代对象为空，返回False

print(any(['',None,False])) #所有为假，返回False

2.3 bool

　　bool值为假的情况

　　　　1.None

　　　　2.空

　　　　3.False

　　　　4.0

2.4 bin oct hex

　　1.bin 十进制转换为二进制

　　2.oct 十进制转换为八进制

　　3.hex十进制转化为十六进制

print(bin(10))   # 0b1010
print(oct(10))   # 0o12
print(hex(10))   # 0xa

2.5 bytes

print('hello'.encode('utf-8'))         # unicode----encode----->bytes
print(bytes('hello',encoding='utf-8')) # 利用bytes把unicode转化为bytes

2.6 callable

　　callable：判断一个对象是否可调用，是否可用加括号运行的，例如：函数

print(callable(bytes))
print(callable(abs))

2.7 chr ord

　　chr：用一个十进制数字，利用chr函数，转换为一个ascii表中的一个字符

　　ord：字符转化为数字

　　A—Z 65到90

print(chr(65))    # A
print(chr(90))    # Z
print(ord('H'))   # 72

2.8 数据类型

　　内置函数，又被称为工厂函数

　　目前了解的数据类型如下：

　　　　1.int 整形

　　　　2.complex 复数

　　　　3.float 浮点

　　　　4.str 字符串

　　　　5.list 列表

　　　　6.tuple 元组

　　　　7.dict 字典

　　　　8.set 可变集合

　　　　9.frozenset 不可变集合

x=1            #x=int(1)
print(type(x)) # <class 'int'>
x=int(2)

s={1,2,3,4}      #s=set({1,2,3,4})
print(type(s))   # <class 'set'>

s1=frozenset({1,2,3,4})
print(type(s1))  # <class 'frozenset'>

2.9 dir

　　利用dir，可以查看一个模块可以调用的属性和方法

import sys
sys.path  # path是sys的属性
print(dir(sys))   # 查看sys点可以调用的属性和方法

2.10 divmod

　　利用divmod，获得被除数除以除数，得到商和余数

print(divmod(10,3))    # (3, 1)
print(divmod(102,20))  # (5, 2)

2.11 enumerate

　　enumerate，把一个可迭代对象，生成一个迭代器

l=['a','b','c']
res = enumerate(l)
for i in res:
    print(i)
for index,item in enumerate(l):
    print(index,item)

2.12 hash

　　hash，校验一个字符串值，只要字符串的值一样，hash结果就一样

print(hash('abcdefg123'))   # hash 结果为：-203804489563080217
print(hash('abcdefg123'))   # hash 结果为：-203804489563080217
print(hash('abcdefg123'))   # hash 结果为：-203804489563080217

2.13 help

　　利用help，查看函数的文档信息；给函数加文档解释，用到单引号，双引号，三引号

def func():
    '''
    test function
    :return:
    '''
    pass

print(help(func))

2.14 id

　　id:是python解释器实现的功能，只是反映了变量在内存的地址，但并不是真实的内存地址

x=1
print(id(x))

def func():pass
print(id(func))
print(func)   # 最精准的内存地址反映

2.15 isinstance

　　isinstance，判断一个变量是否属于一个数据类型

x=1
print(type(x) is int)
print(isinstance(x,int))

2.16 max min

　　max：求最大值，同类型之间进行比较

　　min：求最小值，同类型之间进行比较

print(max([1,2,3,10]))
print(max(['a','b']))
print(min([1,2,3,10]))

2.17 pow

　　pow求幂运算

print(pow(3,5))
print(pow(3,2,2)) #3**2%2

2.18 repr str

　　repr、str都是把数字转化为字符串

　　repr：给解释器用的

　　str：给用户用的

print(type(str(100)))   # 输出结果： <class 'str'>
print(type(repr(100)))  # 输出结果： <class 'str'>

2.19 reversed

　　reversed：反转，也就是倒排序

l=[1,'a',2,'c']
print(list(reversed(l)))   # ['c', 2, 'a', 1] 反转产生新列表，并不反转原列表
print(l)                   # [1, 'a', 2, 'c']

2.20 round

　　利用round，保留小数位数，并进行四舍五入

　　示例

print(round(2.764,2))   # 运行结果：2.76
print(round(2.768,2))   # 运行结果：2.77

2.21 slice

　　slice，是切片的意思，调用slice函数，生产切片对象，方便进行重用，为很多列表所用。

l=[1,2,3,4,5,6]
print(l[0:4:2])

s=slice(0,4,2)
print(l[s])

2.22 sorted

　　排序，同类型之间进行排序

l=[1,10,4,3,-1]
print(sorted(l))   # 排序，从小到大排序，运行结果：[-1, 1, 3, 4, 10]
print(sorted(l,reverse=True)) #从大到小排序，运行结果：[10, 4, 3, 1, -1]

2.23 sum

　　利用sum求和

print(sum([1, 2,3]))
print(sum(i for i in range(10)))

2.24 zip

　　zip拉链，把两个序列类型生成一个小元组列表

s='hello'
l=[1,2,3,4,5]
print(list(zip(s,l)))  # 运行结果：[('h', 1), ('e', 2), ('l', 3), ('l', 4), ('o', 5)]

2.25 import

　　__import__，导入模块，把字符串转化为模块类型

m_name=input('module>>: ')
if m_name == 'sys':
    m=__import__(m_name)
    print(m)
    print(m.path)

sys=__import__('sys')
print(sys)

2.26 内置函数补充

　　薪资字典

salaries={
    'egon':3000,
    'alex':100000000,
    'wupeiqi':10000,
    'yuanhao':2000
}

2.26.1 max

　　获取薪资最大的人名

print(max(salaries,key=lambda name:salaries[name]))
print(min(salaries,key=lambda name:salaries[name]))

　　内置函数max、min的实质是通过循环，比较最大值和最小值，只是默认比较key，可以通过函数的第二个参数key选择比较value值

　　通过max内部实现机制：通过for循环，只获取一个值，传给匿名函数lambda name:salaries[name])，把执行结果作为比较依据，然后进行比较，比较的依据是max的第二个参数的运行结果

salaries={
    'egon':3000,
    'alex':100000000,
    'wupeiqi':10000,
    'yuanhao':2000
}

# 利用zip实现需求，十分复杂
# 知识储备
t1=(10000000,'alex')
t2=(3000,'egon')
print(t1 > t2)    # 运行结果：True
print(max(salaries))            # 最大的name值，运行结果：yuanhao
print(max(salaries.values()))   # 最大的values值，运行结果：100000000
# 取出name和value，利用zip转为元组，最后进行比较
print(max(zip(salaries.values(),salaries.keys()))[1])

def get_value(name):
    return salaries[name]
print(max(salaries,key=get_value))

print(max(salaries,key=lambda name:salaries[name]))   # 薪资最大的人名：alex
print(min(salaries,key=lambda name:salaries[name]))   # 薪资最小的人名：yuanhao

2.26.2 sorted

　　比较薪资从小到大的人名

salaries = {
    "egon":3000,
    "alex":100000000,
    "wupeiqi":100000,
    "yuanhao":2000,
}
def get_value(name):
    return salaries[name]
print(sorted(salaries,key=get_value))   # 运行结果： ['yuanhao', 'egon', 'wupeiqi', 'alex']
print(sorted(salaries,key=lambda name:salaries[name],reverse=True)) #运行结果：['alex', 'wupeiqi', 'egon', 'yuanhao']

2.26.3 map

　　filter、map、reduce，都是对一个集合进行处理；filter很容易理解用于过滤，map用于映射，reduce用于归并. 是Python列表方法的三架马车。

　　map函数：func作用于给定序列的每个元素，并用一个列表来提供返回值

names=['alex','wupeiqi','yuanhao','yanglei','egon']
res=map(lambda x:x if x == 'egon' else x+'SB',names)
print(res)     # 运行结果：<map object at 0x0000000002219B70>
print(list(res)) # 运行结果：['alexSB', 'wupeiqiSB', 'yuanhaoSB', 'yangleiSB', 'egon']

N1=[1,2,3]
N2=[6,5,4]
print(list(map(lambda x,y:x+y,N1,N2)))  # 运行结果：[7, 7, 7]
print(list(map(lambda x:x+3,N1)))       # 运行结果：[4, 5, 6]

2.26.4 reduce

　　reduce函数：func为二元函数，将func作用于seq序列的元素，每次携带一对（先前的结果以及下一个序列的元素），连续的将现有的结果和下一个值作用在获得的随后的结果上，最后减少我们的序列为一个单一的返回值

from functools import reduce
print(reduce(lambda x,y:x+y,range(101),100))  # 运行结果：5150
print(reduce(lambda x,y:x+y,range(101)))      # 运行结果：5050

# 用map和reduce实现5的阶乘相加（5!+4!+3!+2!+1!）
print(reduce(lambda x,y:x*y,range(1,6)))
print(reduce(lambda x,y:x*y,range(1,5)))
print(reduce(lambda x,y:x*y,range(1,4)))
print(reduce(lambda x,y:x*y,range(1,3)))
print(reduce(lambda x,y:x*y,range(1,2)))
#把上一步的结果变成一个阶乘列表
print(list(map(lambda a:reduce(lambda x,y:x*y,range(1,a+1)),range(1,6))))  # 运行结果：[1, 2, 6, 24, 120]
#最后把阶乘列表相加
print(reduce(lambda m,n:m+n,map(lambda a:reduce(lambda x,y:x*y,range(1,a+1)),range(1,6)))) # 运行结果：153

2.26.5 filter

　　filter函数的功能相当于过滤器。调用一个布尔函数bool_func来迭代遍历每个seq中的元素；返回一个使bool_seq返回值为true的元素的序列。

names=['alex_SB','wupeiqi_SB','yuanhao_SB','yanglei_SB','egon']
print(list(filter(lambda name:name.endswith('SB'),names)))    # 运行结果：['alex_SB', 'wupeiqi_SB', 'yuanhao_SB', 'yanglei_SB']

N=range(10)
print(list(filter(lambda x:x>5,N)))  # 运行结果：[6, 7, 8, 9]

3. 正则表达式

3.1 概览

模式	描述
\w	匹配字母数字下划线
\W	匹配非字母数字下划线
\s	匹配任意空白字符，等价于[\t\n\r\f]
\S	匹配任意非空字符
\d	匹配任意数字，等价于[0-9]
\D	匹配任意非数字
\A	匹配字符串开始
\Z	匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串
\z	匹配字符串结束
\G	匹配最后匹配完成的位置
\n	匹配一个换行符
\t	匹配一个制表符
^	匹配字符串开头
$	匹配字符串的结尾
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[…]	用来表示一组字符，单独列出：[amk]匹配’a’,’m’或者’k’
[^…]	不在[]中的字符：[^abc]匹配除了a,b,c之外的字符
*	匹配0个或多个的表达式
+	匹配1个或多个的表达式
?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
{n}	精准匹配n个前面表达式
{n,m}	匹配n到m次，由前面的曾泽表达式定义的片段，贪婪方式
a\|b	匹配a或则b
()	匹配括号内的表达式，也表示一个组

3.2 基本正则

import re
print(re.findall('\w','hello_ | egon 123'))     # 运行结果：['h', 'e', 'l', 'l', 'o', '_', 'e', 'g', 'o', 'n', '1', '2', '3']
print(re.findall('\W','hello_ | egon 123'))     # 运行结果：[' ', '|', ' ', ' ']
print(re.findall('\s','hello_ | egon 123 \n \t'))   # 运行结果：[' ', ' ', ' ', ' ', '\n', ' ', '\t']
print(re.findall('\S','hello_ | egon 123 \n \t'))   # 运行结果：['h', 'e', 'l', 'l', 'o', '_', '|', 'e', 'g', 'o', 'n', '1', '2', '3']
print(re.findall('\d','hello_ | egon 123 \n \t'))   # 运行结果：['1', '2', '3']
print(re.findall('\D','hello_ | egon 123 \n \t'))   # 运行结果：['h', 'e', 'l', 'l', 'o', '_', ' ', '|', ' ', 'e', 'g', 'o', 'n', ' ', ' ', '\n', ' ', '\t']
print(re.findall('h','hello_ | hello h egon 123 \n \t'))    # 运行结果：['h', 'h', 'h']
print(re.findall('\Ahe','hello_ | hello h egon 123 \n \t')) # 运行结果：['he']
print(re.findall('^he','hello_ | hello h egon 123 \n \t'))  # 运行结果：['he']
print(re.findall('123\Z','hello_ | hello h egon 123 \n \t123')) # 运行结果：['123']
print(re.findall('123$','hello_ | hello h egon 123 \n \t123'))  # 运行结果：['123']
print(re.findall('\n','hello_ | hello h egon 123 \n \t123'))    # 运行结果：['\n']
print(re.findall('\t','hello_ | hello h egon 123 \n \t123'))    # 运行结果：['\t']

3.3 . [] [^]

　　.本身代表任意一个字符

　　[]内部可以有多个字符，但是本身只配多个字符中的一个

　　[^…]不在[]中的字符：[^abc]匹配除了a,b,c之外的字符

import re
#.本身代表任意一个字符
print(re.findall('a.c','a a1c a*c a2c abc a c aaaaaac')) # 运行结果：['a1c', 'a*c', 'a2c', 'abc', 'a c', 'aac']
print(re.findall('a.c','a a1c a*c a2c abc a\nc',re.DOTALL)) # 运行结果：['a1c', 'a*c', 'a2c', 'abc', 'a\nc']
print(re.findall('a.c','a a1c a*c a2c abc a\nc',re.S))  #运行结果：['a1c', 'a*c', 'a2c', 'abc', 'a\nc']

#[]内部可以有多个字符，但是本身只配多个字符中的一个
print(re.findall('a[0-9][0-9]c','a a12c a1c a*c a2c a c a\nc',re.S))    #运行结果： ['a12c']
print(re.findall('a[a-zA-Z]c','aac abc aAc a*c a2c a c a\nc',re.S))     #运行结果：['aac', 'abc', 'aAc']
#[^…]不在[]中的字符：[^abc]匹配除了a,b,c之外的字符
print(re.findall('a[^a-zA-Z]c','aac abc aAc a*c a2c a c a\nc',re.S))    #运行结果：['a*c', 'a2c', 'a c', 'a\nc']
print(re.findall('a[\+\/\*\-]c','a-c a+c a/c a1c a*c a2c a\nc',re.S))   #运行结果：['a-c', 'a+c', 'a/c', 'a*c']

3.4 \:转义

原生字符串r rawstring；正则表达式前面加r，表示原生的

import re
#\:转义 r代表rawstring
print(re.findall(r'a\\c','a\c abc')) # 运行结果['a\\c']

3.5 ? * + {}

　　? * + {}：左边有几个字符，如果有的话，贪婪匹配

　　?左边那一个字符有0个或者1个

　　*左边那一个字符有0个或者无穷个

　　+左边那一个字符有1个或者无穷个

　　{n,m}左边的字符有n-m次

import re
#? * + {}：左边有几个字符，如果有的话，贪婪匹配
#?左边那一个字符有0个或者1个
print(re.findall('ab?','aab a ab'))  # 运行结果： ['a', 'ab', 'a', 'ab']

#*左边那一个字符有0个或者无穷个
print(re.findall('ab*','a ab abb abbb abbbb'))  # 运行结果：['a', 'ab', 'abb', 'abbb', 'abbbb']
print(re.findall('ab{0,}','a ab abb abbb abbbb')) # 运行结果：['a', 'ab', 'abb', 'abbb', 'abbbb']

#+左边那一个字符有1个或者无穷个
print(re.findall('ab+','a ab abb abbb abbbb')) # 运行结果：['ab', 'abb', 'abbb', 'abbbb']
print(re.findall('ab{1,}','a ab abb abbb abbbb')) # 运行结果：['ab', 'abb', 'abbb', 'abbbb']

#{n,m}左边的字符有n-m次
print(re.findall('ab{3}','a ab abb abbb abbbb')) # 运行结果：['abbb', 'abbb']
print(re.findall('ab{2,3}','a ab abb abbb abbbb')) # 运行结果：['abb', 'abbb', 'abbb']

3.6 .* .*?

import re
# .* .*?
#.*贪婪匹配，匹配所有字符
print(re.findall('a.*c','a123c456c'))   # 运行结果：['a123c456c']
#.*?非贪婪匹配，获取最短的
print(re.findall('a.*?c','a123c456c'))  # 运行结果：['a123c']

3.7 |

　　| 表示或者，左侧条件成立，不会匹配右侧条件；左侧条件不成立，才匹配右侧条件

print(re.findall('company|companies','Too many companies have gone bankrupt, and the next one is my company')) # 运行结果：['companies', 'company']

3.8 ():分组

import re
# (ab)，匹配成功，显示组内内容ab
# (?:ab) 匹配成功，显示匹配最完全的内容
print(re.findall('ab+','abababab123'))      # 运行结果：['ab', 'ab', 'ab', 'ab']
print(re.findall('ab+123','abababab123'))   # 运行结果：['ab123']

print(re.findall('ab','abababab123'))       # 运行结果：['ab', 'ab', 'ab', 'ab']
print(re.findall('(ab)','abababab123'))     # 运行结果：['ab', 'ab', 'ab', 'ab']
print(re.findall('(a)b','abababab123'))     # 运行结果：['a', 'a', 'a', 'a']
print(re.findall('a(b)','abababab123'))     # 运行结果：['b', 'b', 'b', 'b']
print(re.findall('(ab)+','abababab123'))    # 运行结果：['ab']
print(re.findall('(?:ab)+','abababab123'))  # 运行结果：['abababab']

print(re.findall('(ab)+123','abababab123')) # 运行结果：['ab']
print(re.findall('(?:ab)+123','abababab123'))   # 运行结果：['abababab123']
print(re.findall('(ab)+(123)','abababab123'))   # 运行结果：[('ab', '123')]

print(re.findall('compan(y|ies)','Too many companies have gone bankrupt, and the next one is my company'))  # 运行结果：['ies', 'y']
print(re.findall('compan(?:y|ies)','Too many companies have gone bankrupt, and the next one is my company')) # 运行结果：['companies', 'company']

4. 模块

4.1 re模块

4.1.1 findall

　　匹配成功，接着匹配，查找匹配成功的所有内容

print(re.findall('ab','abababab123')) # 运行结果：['ab', 'ab', 'ab', 'ab']

4.1.2 search

　　匹配成功一次，直接返回；只找到匹配成功一次结果。利用group查看内容

print(re.search('ab','ababab123').group())  # 运行结果：ab
print(re.search('ab','12aasddds'))          # 运行结果：None
print(re.search('ab','12aasab3ss').group()) # 运行结果：ab

4.1.3 match

　　从开头开始查找，可以用search代替

print(re.search('ab','123ab456')) 
print(re.match('ab','123ab456'))   # 等价于print(re.search('^ab','123ab456'))

4.1.4 split

　　切分

print(re.split('b','abcde'))    # 运行结果：['a', 'cde']
# 利用a切分之后，再用b进行切分
print(re.split('[ab]','abcde')) # 运行结果：['', '', 'cde']

4.1.5 sub

　　sub：替换

print(re.sub('alex','SB','alex make love alex alex'))       # 运行结果：SB make love SB SB
# 指定替换次数
print(re.sub('alex','SB','alex make love alex alex',2))       # 运行结果：SB make love SB alex
print(re.subn('alex','SB','alex make love alex alex',2))    # 运行结果：('SB make love SB alex', 2)

print(re.sub('(\w+)( .* )(\w+)',r'\3\2\1','alex make love'))# 运行结果：love make alex

4.2 time模块

　　三种形式的时间：时间戳、结构化时间、格式化的字符串时间

　　各种时间之间的转换关系

import time

print(time.time())                  #时间戳， 运行结果：1502011120.8090527
print(time.strftime('%Y-%m-%d %X')) # 格式化字符串时间 运行结果：2017-08-06 17:18:40

print(time.localtime())     # 格式化时间运行结果：time.struct_time(tm_year=2017, tm_mon=8, tm_mday=6, tm_hour=17, tm_min=18, tm_sec=40, tm_wday=6, tm_yday=218, tm_isdst=0)
print(time.gmtime())        #UTC 运行结果：time.struct_time(tm_year=2017, tm_mon=8, tm_mday=6, tm_hour=9, tm_min=18, tm_sec=40, tm_wday=6, tm_yday=218, tm_isdst=0)
print(time.localtime().tm_mon)  # 运行结果：8

print(time.localtime(123123123))    # 运行结果：time.struct_time(tm_year=1973, tm_mon=11, tm_mday=26, tm_hour=8, tm_min=52, tm_sec=3, tm_wday=0, tm_yday=330, tm_isdst=0)
print(time.gmtime(123123123))       # 运行结果：time.struct_time(tm_year=1973, tm_mon=11, tm_mday=26, tm_hour=0, tm_min=52, tm_sec=3, tm_wday=0, tm_yday=330, tm_isdst=0)

print(time.mktime(time.localtime()))    # 运行结果：1502011120.0
print(time.strftime('%Y',time.gmtime()))    # 运行结果：2017

print(time.strptime('2017-03-01','%Y-%m-%d'))  # 运行结果：time.struct_time(tm_year=2017, tm_mon=3, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=2, tm_yday=60, tm_isdst=-1)

print(time.ctime(12312312))     # 运行结果：Sat May 23 20:05:12 1970
print(time.asctime(time.gmtime()))  # 运行结果：Sun Aug  6 09:18:40 2017

4.3 random

import random

print(random.random())  # (0,1)----float 大于0且小于1之间的小数
print(random.randint(1, 3))  # [1,3]    大于等于1且小于等于3之间的整数
print(random.randrange(1, 3))  # [1,3)    大于等于1且小于3之间的整数
print(random.choice([1, '23', [4, 5]]))  # 1或者23或者[4,5]
print(random.sample([1, '23', [4, 5]], 2))  # 列表元素任意2个组合
print(random.uniform(1, 3))  # 大于1小于3的小数，如1.927109612082716
item = [1, 3, 5, 7, 9]
random.shuffle(item)  # 打乱item的顺序,相当于"洗牌"
print(item)

　　生成随机验证码

import random

def make_code(n):
    res = ""
    for i in range(n):
        s1 = str(random.randint(0,9))
        s2 = chr(random.randint(65,90))
        res += random.choice([s1,s2])
    return res

print(make_code(10))    # 运行结果：92324635B3

4.4 os模块

　　os模块是与操作系统交互的一个接口

os.getcwd() 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录；相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名：('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')    生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符，win下为"\\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符，win下为"\t\n",Linux下为"\n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令，直接显示
os.environ  获取系统环境变量
os.path.abspath(path)  返回path规范化的绝对路径
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是绝对路径，返回True
os.path.isfile(path)  如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

View Code

　　示例：

import os

print(os.listdir('.'))
print(os.stat('m1.py').st_size)

print(os.sep)
print(os.linesep)
print(os.pathsep)

print([os.sep,os.linesep,os.pathsep])

res=os.system('dir .')  # 运行结果：返回命令执行结果

print(os.path.dirname(r'C:\a\b\c\d\a.txt')) # 运行结果：C:\a\b\c\d
print(os.path.basename(r'C:\a\b\c\d\a.txt'))# 运行结果：a.txt
print(os.path.split(r'C:\a\b\c\d\a.txt'))   # 运行结果：('C:\\a\\b\\c\\d', 'a.txt')

print(os.stat('m1.py').st_atime)    # 运行结果：1502012851.6810527
print(os.stat('m1.py').st_size)     # 运行结果：49
print(os.path.getsize('m1.py'))     # 运行结果：49

print(os.path.join('C:\\','a','b','c','d.txt')) # 运行结果：C:\a\b\c\d.txt
print(os.path.join('C:\\','a','b','D:\\','c','d.txt')) # 运行结果：D:\c\d.txt

print(os.path.normcase('c:/wiNdows\\system32\\')) # 运行结果：c:\windows\system32\

print(os.path.normpath('c://wIndows\\System32\\../Temp/')) # 运行结果：c:\wIndows\Temp

a='/Users/jieli/test1/\\\a1/\\\\aa.py/../..'
print(os.path.normpath(a)) # 运行结果：\Users\jieli\test1

print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))   # 运行结果：D:\python\code\Learning

BASE_DIR=os.path.normpath(os.path.join(
        os.path.abspath(__file__),
        '..',
        '..'
    )
)
print(BASE_DIR)    # 运行结果：D:\python\code\Learning

4.5 Sys模块

4.5.1 介绍

　　1 sys.argv 命令行参数List，第一个元素是程序本身路径

　　2 sys.exit(n) 退出程序，正常退出时exit(0)

　　3 sys.version 获取Python解释程序的版本信息

　　4 sys.maxint 最大的Int值

　　5 sys.path 返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值

　　6 sys.platform 返回操作系统平台名称

4.5.2 sys.stdout实现进度条

import sys,time

for i in range(1,100):
    sys.stdout.write('\r%s' %('#'*i))
    sys.stdout.flush()
    time.sleep(0.5)

4.5.3 print实现进度条实现

import sys,time
for i in range(1,100):
    print('\r%s' %('#'*i),file=sys.stdout,flush=True,end='')
    time.sleep(0.05)

4.5.4进度条应用

　　知识储备

# 通过传入参数，指定滚动条的固定宽度

print('<%s>' %'hello')
print('<%-10s>' %'hello')

print('<%-10s>' %'#')
print('<%-10s>' %'##')
print('<%-10s>' %'###')
print('<%-10s>' %'####')
print('<%-10s>' %'#####')

width=20
print('<%%-%ds>' %width) #<%-10s>
print(('<%%-%ds>' %width) %('hello'))  # <%-10s> %('hello')


print(('[%%-%ds]' %width) %('#'))
print(('[%%-%ds]' %width) %('##'))
print(('[%%-%ds]' %width) %('###'))

　　实现打印进度条函数

import sys,time
def progress(percent,width=50):
    if percent >= 100:
        percent=100
    show_str=('[%%-%ds]' %width) %(int(width*percent/100)*'#')
    print('\r%s %d%%' %(show_str,percent),file=sys.stdout,flush=True,end='')

total_size=80251
recv_size=0

while recv_size < total_size:
    time.sleep(0.3) #模拟下载的网络延迟
    recv_size+=1024
    recv_per=int(100*recv_size/total_size)
    progress(recv_per,width=50)

4.6 序列化

　　为什么要序列化？

　　　　1.持久保存状态

　　　　2.跨平台数据交互

4.6.1 json

　　JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

　　JSON表示的对象就是标准的JavaScript语言的对象，JSON和Python内置的数据类型对应如下：

import json
dic={'name':'egon','age':18}
# 利用dumps序列化
print(type(json.dumps(dic)))
with open('a.json','w') as f:
    f.write(json.dumps(dic))
# 利用loads反序列化
with open('a.json','r') as f:
    data=f.read()
    dic=json.loads(data)
    print(dic['name'])

dic={'name':'egon','age':18}
# 利用dump序列化
json.dump(dic,open('b.json','w'))
# 利用load反序列化
print(json.load(open('b.json','r'))['name'])

4.6.2 pickle

　　Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。

import pickle

dic={'name':'egon','age':18}
# dumps序列化
print(pickle.dumps(dic))
with open('d.pkl','wb') as f:
    f.write(pickle.dumps(dic))
# loads反序列化
with open('d.pkl','rb') as f:
    dic=pickle.loads(f.read())
    print(dic['name'])

dic={'name':'egon','age':18}
# dump序列化
pickle.dump(dic,open('e.pkl','wb'))
# load反序列化
print(pickle.load(open('e.pkl','rb'))['name'])

　　利用pickle进行序列化python的函数，然后进行反序列化

import pickle

def func():
    print('反序列化的文件')

# 利用dump把函数进行序列化
pickle.dump(func,open('func.pkl','wb'))
# 利用load把函数进行反序列化
f=pickle.load(open('func.pkl','rb'))
print(f)
f()

4.7 shelve模块

　　shelve模块比pickle模块简单，只有一个open函数，返回类似字典的对象，可读可写;key必须为字符串，而值可以是python所支持的数据类型

4.7.1 序列化

import shelve

# 进行序列化
f=shelve.open(r'sheve.shl')
f['alex']={'age':28,'pwd':'alex3714'}
f['egon']={'age':18,'pwd':'3714'}
f.close()

4.7.2 反序列化

import shelve

obj=shelve.open(r'sheve.shl')

print(obj['alex'])
print(obj['egon'])

for i in obj:
    print(i,obj[i])
obj.close()

posted @ 2017-08-09 22:43 平凡执着阅读(388) 评论(0) 收藏举报

刷新页面返回顶部

平凡执着