python数据分析-List（上）

列表（list）作为python最基础也是最重要的数据类型之一，在python数据分析以及其他用途中有着重要的作用。

在此，将通过两篇文章来对List做一个相对系统的介绍，希望下述内容能对于熟悉list有所帮助。

1 初识list

list 是 Python 内置的一种高级数据类型。 list是一种有序的集合，在python中应用很广泛。

names = ['James', 'Michael', 'Emma', 'Emily']
print("names的数据类型：",type(names))
print(names)

names的数据类型： <class 'list'>
['James', 'Michael', 'Emma', 'Emily']

用 len() 可获得 list 的长度，即list集合所包含的元素个数，如下：

n = len(names)
print(n)

空的list

如果list中一个元素也没有，我们可以定义一个空的list，则其长度为0，如下：

empty_list = []
empty_list

[]

len(empty_list)

2 访问列表中的值

用索引来访问 list 中的每个元素，请注意索引是从 0 开始，最后一个的索引编号为 n-1，即所有元素的编号依次为 (0,1, 2, ..., n-1)。

list中单个元素的访问如下：

names[0]

'James'

names[1]

'Michael'

如果要获取最后一个元素，也可以用 -1 来做索引，倒数第二个元素可以用 -2 来索引，其他以此类推。

names[-1]

'Emily'

names[-2]

'Emma'

可以通过 for 循环来列出所有元素。有两种方法可以实现，如下：

方法1

for name in names:
print(name)

James
Michael
Emma
Emily

方法2

for i in range(len(names)):
print(names[i])

James
Michael
Emma
Emily

3 列表的操作、函数及方法

3.1 list中元素的增、改、删等操作

list是一个可变的有序列表，可以通过添加、修改、删除等操作来操作list中的元素。

往list中添加元素

可以通过 append() 和 insert() 方法来往 list 中添加元素。

其中， append() 方法是在 list 的末尾添加元素； insert() 是在指定位置添加元素。

如下：

names.append('Jacob')
names

['James', 'Michael', 'Emma', 'Emily', 'Jacob']

names.insert(1, 'Ava')
names

['James', 'Ava', 'Michael', 'Emma', 'Emily', 'Jacob']

请注意，上述 insert() 方法中， "1" 表示在第2个位置添加新的元素（索引是从0开始的）

删除list中的元素

用 pop() 方法删除list末尾的元素

names.pop()

'Jacob'

names

['James', 'Ava', 'Michael', 'Emma', 'Emily']

删除指定位置的元素，用 pop(i) 方法

names.pop(0)

'James'

names

['Ava', 'Michael', 'Emma', 'Emily']

修改list中的元素

如果需要修改 list 中的元素，可以直接通过 list 的索引进行赋值来实现，如下：

names[2] = 'Lemon'
names

['Ava', 'Michael', 'Lemon', 'Emily']

3.2 列表操作符

列表可以进行相加 "+" 和相乘 "*" 运算，"+" 相当于拼接列表， "*" 相当于重复列表。

此外，还可以判断元素是否存在于列表中。

# 列表相加
print("列表相加：",[1,2,3]+['a','b'])
# 列表相乘
print("列表相乘：",['a','b']*3)
# 判断元素是否存在于列表中
print("判断元素是否存在于列表中：", 'a' in ['a', 'b'])
print("判断元素是否存在于列表中：", 'a' not in ['a', 'b'])

列表相加： [1, 2, 3, 'a', 'b']
列表相乘： ['a', 'b', 'a', 'b', 'a', 'b']
判断元素是否存在于列表中： True
判断元素是否存在于列表中： False

3.3 列表函数&方法

列表的函数包括：

len(list)，列表元素个数，即列表的长度
max(list)，返回列表元素最大值
min(list)，返回列表元素最小值
list(sep)，将元组转为列表

列表的方法

列表的方法除了前面提到的增、改、删等方法外，还有其他一些方法，如下：

list.count(obj)，统计某个元素在列表中出现的次数
list.extend(seq)，在列表末尾一次性追加另一个序列中的多个值（用新列表扩展原来的列表）
list.index(obj)，从列表中找出某个值第一个匹配项的索引位置
list.remove(obj)，移除列表中某个值的第一个匹配项
list.sort()，对原列表进行排序
list.reverse()，对原列表进行反向排序

list1 = [1,2,3,9,6,3]
list2 = [3, 8, 5, 4, 7,4]
tuple1 = (3,9,6)
# 列表的函数
print("列表最大值：",max(list1))
print("列表最小值：",min(list1))
print("将元组转为列表：",list(tuple1))
# 列表的方法
print("count：",list1.count(3))
list1.extend(list2)
print("extend：",list1)
print("index：",list2.index(4))
list2.remove(4)
print("remove：",list2)
list2.sort()
print("sort：",list2)
list2.reverse()
print("reverse：",list2)

列表最大值： 9
列表最小值： 1
将元组转为列表： [3, 9, 6]
count： 2
extend： [1, 2, 3, 9, 6, 3, 3, 8, 5, 4, 7, 4]
index： 3
remove： [3, 8, 5, 7, 4]
sort： [3, 4, 5, 7, 8]
reverse： [8, 7, 5, 4, 3]

4 list中元素的类型可以多样

同一个 list 中的元素的类型可以是字符串（str）、整型（int）、布尔型（Boolean）、以及嵌套的list等，举例如下：

a_list = ['Lemon', 100, ['a', 'b', 'c', 'd'], True]
a_list

['Lemon', 100, ['a', 'b', 'c', 'd'], True]

a_list[0]

'Lemon'

a_list[2]

['a', 'b', 'c', 'd']

在上述的 a_list 中，第3个元素 (即 alist[2]) 其实本身也是一个 list。

list中的元素也可以是list，这样的话，可以进行多重list的嵌套。

上述 list，也可以按下述方式来理解。

b_list = ['a', 'b', 'c', 'd']
a_list = ['Lemon', 100, b_list, True]
a_list

['Lemon', 100, ['a', 'b', 'c', 'd'], True]

针对 a_list ，如果想获取其中元素 b_list 里面的单个元素 “b”，该如何实现呢？

其实，这个类似二维数组，用二维的索引可以获取，如下：

item_b = a_list[2][1]
item_b

'b'

上述 [2] 表示获取 a_list 的第3个元素，即 b_list， [1] 表示获取 b_list 的第2个元素，即“b”

5 list 的切片（slices）

前面描述了 list 中单个元素如何获取，如果想获取其中连续的部分元素，该如何实现呢。

这里可以通过切片(slices)的形式来获取部分连续的元素。

c_list = ['James', 'Ava', 'Michael', 'Emma', 'Emily', 'Jacob']
c_list

['James', 'Ava', 'Michael', 'Emma', 'Emily', 'Jacob']

list 中以切片形式使用时，其结构可参考 new_list[start: end : step]

其中 "start" 和 "end" 表示索引位置的开始和结束，选取的元素包含 "start"，但不包含 "end"。

"step" 表示步长，默认情况下， "step"为1，演示如下：

Example-1:

c_list[1:3]

['Ava', 'Michael']

example-1 中， 1:3 表示切片选取的是第2个元素和第3个元素，即包含索引为1和索引为2的元素。相当于获取 c_list[1] 和 c_list[2]

Example-2:

c_list[::2]

['James', 'Michael', 'Emily']

example-2 中 "start" 和 "end" 为空的时候，默认是全选，即 "start" 为 0， "end" 为 len(c_list)-1。

所以 c_list[::2] 表示的是从索引为 0 开始，以步长为2来选择元素。

接下来看以下结合上述两个例子的演示：

c_list[1:3:2]

['Ava']

Example-3:

前面提到，new_list[-1]表示获取最后一个元素，在切片的步长 "step" 中，也可以是负数，比如 "-1"：

c_list[::-1]

['Jacob', 'Emily', 'Emma', 'Michael', 'Ava', 'James']

从上述结果可以看出，当 "step"为 -1 时，我们发现是将列表进行了逆序排序。

再看看步长为 "-2" 时的结果：

c_list[::-2]

['Jacob', 'Emma', 'Ava']

可以这么理解，当步长为正数时，是从左到右以该步长来获取列表中的元素；

而当步长为负数时，是从右到左以该步长的绝对值来获取列表中的元素。

Example-4:

如果想获取离散的元素，比如想获得第1、2、4个元素，能不能通过离散的索引值来获取呢？

我们先来试验一下：

# c_list[0, 1, 3]

c_list[0, 1, 3]
out:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-30-68d834a60325> in <module>()
----> 1 c_list[0, 1, 3]
TypeError: list indices must be integers or slices, not tuple

从运行结果可以之道，直接取离散的索引号是不行的，它提示 list的索引必须是整数或者 slices。

那么，我们有没有方法来获取这些离散的元素呢？

方法肯定是有的，其中一种方法就是使用列表推导式。

posted @ 2022-09-02 11:38 江南_JN 阅读(194) 评论(0) 收藏举报

刷新页面返回顶部

jiangnanjiangnan