全部文章

09.推导式

Python 推导式是一种独特的数据处理方式,可以从一个数据序列构建另一个新的数据序列的结构体。

Python 推导式是一种强大且简洁的语法,适用于生成列表、字典、集合和生成器。

在使用推导式时,需要注意可读性,尽量保持表达式简洁,以免影响代码的可读性和可维护性。

Python 支持各种数据结构的推导式:

  • 列表(list)推导式
  • 字典(dict)推导式
  • 集合(set)推导式
  • 元组(tuple)推导式

列表推导式

列表推导式格式为:

[表达式 for 变量 in 列表] 
[out_exp_res for out_exp in input_list]

或者 

[表达式 for 变量 in 列表 if 条件]
[out_exp_res for out_exp in input_list if condition]
  • out_exp_res:列表生成元素表达式,可以是有返回值的函数。
  • for out_exp in input_list:迭代 input_list 将 out_exp 传入到 out_exp_res 表达式中。
  • if condition:条件语句,可以过滤列表中不符合条件的值。

过滤掉长度小于或等于3的字符串列表,并将剩下的转换成大写字母:

# 列表的推导式
# 过滤掉长度小于或等于3的字符串列表,并将剩下的转换成大写字母:
list1=["one","two","three","four","five","six","seven","eight"]
newlist=[num.upper() for num in list1 if len(num)>3]
print(newlist)
# 计算 30 以内可以被 3 整除的整数:
numbersToBeDivisibleByThree=[i for i in range(30) if i%3==0]
print(numbersToBeDivisibleByThree)

字典推导式

字典推导基本格式:

{ key_expr: value_expr for value in collection }

或

{ key_expr: value_expr for value in collection if condition }

使用字符串及其长度创建字典:

# 字典推导式
# 使用字符串及其长度创建字典:
list1=["one","two","three","four","five","six","seven","eight"]
newDict={value:len(value) for value in list1}
print(newDict)
# 提供三个数字,以三个数字为键,三个数字的平方为值来创建字典:
dict2={num:num**2 for num in [1,2,3]}
print(dict2)

集合推导式

集合推导式基本格式:

{ expression for item in Sequence }
或
{ expression for item in Sequence if conditional }

计算数字 1,2,3 的平方数:

# 集合的推导式
newSet={str for str in "abcdefghijk"}
print(newSet)#{'a', 'c', 'b'}

newSet={str for str in "abcdefghijk" if str not in "abc"}
print(newSet)#{'h', 'f', 'e', 'i', 'd', 'j', 'k', 'g'}

元组推导式(生成器表达式)

元组推导式可以利用 range 区间、元组、列表、字典和集合等数据类型,快速生成一个满足指定需求的元组。

元组推导式基本格式:

(expression for item in Sequence )
或
(expression for item in Sequence if conditional )

元组推导式和列表推导式的用法也完全相同,只是元组推导式是用 () 圆括号将各部分括起来,而列表推导式用的是中括号 [],另外元组推导式返回的结果是一个生成器对象。

例如,我们可以使用下面的代码生成一个包含数字 1~9 的元组:

# 元组表达式(生成器表达式)
setnew = (i**2 for i in (1,2,3))
print(setnew)#<generator object <genexpr> at 0x7faf6ee20a50>  # 返回的是生成器对象
print(list((setnew)))# # 使用 tuple() /list()/set()等函数,可以直接将生成器对象转换成对应数据类型
在 Python 中,你写的 (i**2 for i in (1,2,3)) 实际上创建的是生成器表达式(generator expression),而不是元组(tuple)。这是 Python 语法的特殊规定:
  1. 元组的创建方式有两种:
    • 直接用逗号分隔元素:(1, 2, 3) 或 1, 2, 3
    • 使用 tuple() 函数转换:tuple(i**2 for i in (1,2,3))
  2. 为什么你的代码不是元组?
    • 当括号中包含 for 循环时,Python 会将其解析为生成器表达式(一种惰性计算的迭代器)
    • 生成器表达式的语法就是用圆括号包裹,这和元组的括号形式冲突,所以 Python 优先识别为生成器

简单说:圆括号在 Python 中具有双重含义,既可以表示元组,也可以表示生成器表达式,当里面有 for 循环时,会被优先解释为生成器表达式。

 循环的使用技巧

>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]

应用案例

配合python的一些方法,可以用来清洗数据:

例如strip()方法:默认删除空白符(包括’ ’,‘\r’,‘\t’,’')对于爬数据如果出现空白符,只要写的时候加个.strip()

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

 

posted @ 2025-03-10 16:12  指尖下的世界  阅读(18)  评论(0)    收藏  举报