09.推导式
Python 推导式是一种独特的数据处理方式,可以从一个数据序列构建另一个新的数据序列的结构体。
Python 推导式是一种强大且简洁的语法,适用于生成列表、字典、集合和生成器。
在使用推导式时,需要注意可读性,尽量保持表达式简洁,以免影响代码的可读性和可维护性。
Python 支持各种数据结构的推导式:
- 列表(list)推导式
- 字典(dict)推导式
- 集合(set)推导式
- 元组(tuple)推导式
列表推导式
列表推导式格式为:
[表达式 for 变量 in 列表]
[out_exp_res for out_exp in input_list]
或者
[表达式 for 变量 in 列表 if 条件]
[out_exp_res for out_exp in input_list if condition]
- out_exp_res:列表生成元素表达式,可以是有返回值的函数。
- for out_exp in input_list:迭代 input_list 将 out_exp 传入到 out_exp_res 表达式中。
- if condition:条件语句,可以过滤列表中不符合条件的值。
过滤掉长度小于或等于3的字符串列表,并将剩下的转换成大写字母:
# 列表的推导式
# 过滤掉长度小于或等于3的字符串列表,并将剩下的转换成大写字母:
list1=["one","two","three","four","five","six","seven","eight"]
newlist=[num.upper() for num in list1 if len(num)>3]
print(newlist)
# 计算 30 以内可以被 3 整除的整数:
numbersToBeDivisibleByThree=[i for i in range(30) if i%3==0]
print(numbersToBeDivisibleByThree)
字典推导式
字典推导基本格式:
{ key_expr: value_expr for value in collection }
或
{ key_expr: value_expr for value in collection if condition }
使用字符串及其长度创建字典:
# 字典推导式
# 使用字符串及其长度创建字典:
list1=["one","two","three","four","five","six","seven","eight"]
newDict={value:len(value) for value in list1}
print(newDict)
# 提供三个数字,以三个数字为键,三个数字的平方为值来创建字典:
dict2={num:num**2 for num in [1,2,3]}
print(dict2)
集合推导式
集合推导式基本格式:
{ expression for item in Sequence }
或
{ expression for item in Sequence if conditional }
计算数字 1,2,3 的平方数:
# 集合的推导式
newSet={str for str in "abcdefghijk"}
print(newSet)#{'a', 'c', 'b'}
newSet={str for str in "abcdefghijk" if str not in "abc"}
print(newSet)#{'h', 'f', 'e', 'i', 'd', 'j', 'k', 'g'}
元组推导式(生成器表达式)
元组推导式可以利用 range 区间、元组、列表、字典和集合等数据类型,快速生成一个满足指定需求的元组。
元组推导式基本格式:
(expression for item in Sequence )
或
(expression for item in Sequence if conditional )
元组推导式和列表推导式的用法也完全相同,只是元组推导式是用 () 圆括号将各部分括起来,而列表推导式用的是中括号 [],另外元组推导式返回的结果是一个生成器对象。
例如,我们可以使用下面的代码生成一个包含数字 1~9 的元组:
# 元组表达式(生成器表达式)
setnew = (i**2 for i in (1,2,3))
print(setnew)#<generator object <genexpr> at 0x7faf6ee20a50> # 返回的是生成器对象
print(list((setnew)))# # 使用 tuple() /list()/set()等函数,可以直接将生成器对象转换成对应数据类型
简单说:圆括号在 Python 中具有双重含义,既可以表示元组,也可以表示生成器表达式,当里面有
for循环时,会被优先解释为生成器表达式。
循环的使用技巧
>>> vec1 = [2, 4, 6] >>> vec2 = [4, 3, -9] >>> [x*y for x in vec1 for y in vec2] [8, 6, -18, 16, 12, -36, 24, 18, -54] >>> [x+y for x in vec1 for y in vec2] [6, 5, -7, 8, 7, -5, 10, 9, -3] >>> [vec1[i]*vec2[i] for i in range(len(vec1))] [8, 12, -54]
应用案例
配合python的一些方法,可以用来清洗数据:
例如strip()方法:默认删除空白符(包括’ ’,‘\r’,‘\t’,’')对于爬数据如果出现空白符,只要写的时候加个.strip()
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] >>> [weapon.strip() for weapon in freshfruit] ['banana', 'loganberry', 'passion fruit']

浙公网安备 33010602011771号