Fork me on GitHub

Python内置数据结构--列表

本节内容:

  • 列表
  • 元组
  • 字符串
  • 集合
  • 字典

本节先介绍列表。

 

一、列表

一种容器类型。列表可以包含任何种类的对象,比如说数字、子串、嵌套其他列表、嵌套元组。
任意对象的有序集合,通过索引访问其中的元素。其长度可变,支持异构(在一个列表中可以包含多种不同类型的元素),可以任意嵌套。
列表是可变对象,支持在原处修改。列表的可变变现在其内部的每一个元素存储在列表中不是对象本身,而是对象的引用。因此其修改的是对象的引用。

help()是ipython里特有的函数,可以打印出类、函数的一些信息。

In [1]: help(list)

Help on class list in module builtins:

class list(object)
 |  list() -> new empty list
 |  list(iterable) -> new list initialized from iterable's items
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
...

  

1. 初始化列表

list(),里面可以什么都不放,也可以放可迭代对象。
直接一个[]

In [2]: lst = list()

In [3]: lst = []

In [4]: lst
Out[4]: []

In [5]: lst = [1, 2, 3]

In [6]: lst
Out[6]: [1, 2, 3]

  

2. 下标/索引操作

python中list的索引从0开始。绝大多数语言的下标是从0开始的,也有少部分例外,比如awk、lua。
负数的索引表示从后往前数,由-1开始,-1表示最后一个元素。

In [6]: lst
Out[6]: [1, 2, 3]

In [7]: lst[0]
Out[7]: 1

In [8]: lst[-1]
Out[8]: 3
如果索引超出范围,将引发IndexError。

In [9]: lst[-4]
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-9-7ea420056b9a> in <module>()
----> 1 lst[-4]

IndexError: list index out of range

In [10]: lst[3]
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-10-298ffefac8cf> in <module>()
----> 1 lst[3]

IndexError: list index out of range

修改元素的时候,如果超出索引范围,也会引发IndexError。

 

  

 

3. 列表的操作

  • 增:append、extend、insert
  • 删:clear、pop、remove
  • 改:reverse、sort
  • 查:count、index
  • 其他:copy

 

(1)给list增加元素

append:

append方法原地修改list,给list最后增加一个元素。append方法的返回值是None。

 

insert:

insert方法操作的索引超出范围时,如果是正索引,等效于append,如果是负索引,等效于insert(0, object)
insert的时间复杂度是O(n),append的时间复杂度是O(1)。因为insert是要做一个遍历的。
 

extend:

extend的时间复杂度是O(n),这个n是可迭代对象的长度,并不是原有list的长度n。
 

(2)删除元素

pop:

可以传入index,默认从最后移除一个元素,并且把这个元素返回回来。

index默认是-1,即最后一个元素,如果index超出索引范围,会抛出IndexError。

 

remove:

pop是弹出索引对应的值,remove是删除最左边的一个值。
pop针对的是索引,remove针对的是值。

remove的时候,如果值不存在,会抛出ValueError。

 

pop和remove的时间复杂度都是O(n)

 

clear:

clear方法删除列表的所有元素。
 

(4)查找/统计元素

可以利用index查询

 

index:

 

start包含,stop不包含。即[start, stop)
index方法根据值查找索引。

 

count:

count返回指定的value在List中出现的次数。

len函数

不是List的方法,它是python的一个内置函数,用于检查List元素个数。并不仅仅是针对List,可以针对很多对象。

 

(5)修改列表

sort:

原处是指直接修改List

 

reverse:

原处是指直接修改List

 

(6)其他方法

 copy:

 

如何删除后面的2?

如果不想在原List上做修改:

lst2 = lst,只是一个指针指到lst指到的那块内存,因此操作lst2的时候,lst也被修改了。因为它们两个都是指针,指到同一块内存。这就用到List的copy函数了。

搞错了,不是深copy,只是一层copy。

 

id()打印出引用指向的内存块的地址。

 

成员关系判断
  • in
  • not in

 

【举例】:如何去除List中的重复元素

 

列表相加:合并两个列表,生成了一个新列表。不会修改原列表。这个和子串的相加是一样的,生成新的子串。

 

序列相乘:就是重复元素多次。都是生成新对象。
子串乘法:

列表乘法:

 

 

4. 切片

切片通常是用来访问数据的,如果你对切片赋值的话,产生的结果是不可预料的。切片操作总是返回一个新的list,不会改变原有的list

 

 

seq[start, end]     [start, end)

  

如果想获取到最后一个元素,省略end

 

 

以上都是从左往右切片,所以左边的数字要小于右边的数字。

start超出索引范围从0开始,end超出索引范围到到len(lst)结束。

 

 

start为0时可以省略,end省略表示打印到最后一个元素,start和end都省略就是copy。

 

切片还有一个第3个参数:step,默认是1

 

当step为负数的时候,从后往前数,此时start应该大于end,否则返回空列表。

 

 

 

 

切片赋值

对切片赋值,会替换切片原来的元素。

 

通常我们是不会对切片进行赋值的,会造成很多的误解。

5. 解包/封包

看一个例子,传统的swap

但是在python里面不需要这么做

 

原来中间的3行代码变成了现在的1行代码,这就是解包/封包。
最简单的解包就是如下:把右边的元组或者列表(可迭代对象都行)解开成了左边的两个变量,这种就是解包。

 

封包就是把一组变量,变成元组。把若干变量或常量封装到一个变量里,这就是封包。

我们显式的使用封包比较少,但是解包用的很多。

 

应用场景:

 

 

 

 

解包是把集合里的元素赋值给变量(集合可以是可迭代对象),赋值完的变量要么是一个值,要么是个list,而不管右侧集合是列表还是元组。
封包是把变量构建成元组。下面的这种用法python2是不支持的。

 

比如我想取出list中的下标是0,1,3元素,切片是不好做的:

 

下划线_ 是指当我们要丢弃一个变量时使用的。

再如,我们取一头一尾:

 

 

再看两个复杂点的:

只要两边结构是一样的,解包多少层都是可以的。

 

 

 

 

posted @ 2018-04-30 19:55  暴走小骚年  阅读(2467)  评论(0编辑  收藏  举报