Python:列表,元组
一、列表
和字符串一样,列表也是序列类型,因此可以通过下标或者切片操作访问一个或者多个元素。但是,不一样的,列表是容器类型,是可以进行修改、更新的,即当我们进行修改列表元素,加入元素等操作的时候,是对原始对象自身的直接变更,而非新对象的创建。
列表可以以任何类型对象作为自己的元素(包括用户自定义类型),而且更为灵活的是,一个列表中可以同时容纳不同类型的对象(这是C/C++中的数组或vector所不能做到的)。
1.创建列表
|
1
2
3
4
|
listDemo1 = [123, 'abc', 45.6, ['a', 'b', 'c'], 7-9j] listDemo2 = [None, 'something here'] #first element is None listDemo3 = [] #empty list listDemo4 = list() #factory method. return an empty list |
2.访问
|
1
2
|
listDemo1[0] #return 123 listDemo1[1:4] #return ['abc', 45.6, ['a', 'b', 'c']] |
3.更新
|
1
2
3
4
5
6
|
listDemo1[0] += 66listDemo1.append('I am new comer') #追加一个新元素 listDemo1 += ['append again'] #再次追加一个元素 #注意:在这些过程中,listDemo1所指向的始终是原有的对象,没有新 #对象被创建,你可以多用id()测试一下 |
4.删除元素和自身
|
1
2
3
4
5
6
7
8
|
#删除一个元素 del listDemo1[0] #删除多个元素 del listDemo[1:3] #删除自身 del listDemo1 #使用pop()方法删除 a = listDemo2.pop[1] #删除下标为1的元素并赋予将其返回给a |
5.操作符
标准类型操作符:=,<,>,==,<=,>=及cmp()函数
对列表使用比较操作符和cmp时的规则较为特殊,基本逻辑是这样的:两个列表的元素依次比较,直到有一方胜出。
序列类型操作
|
1
2
3
4
5
6
7
|
#对列表进行切片返回的仍然是列表 alpha = ['a', 'b', 'c', ['d', 'e', 'f']] alpha_part = alpha[2:] alpha_part #return ['c', ['d', 'e', 'f']] #切片的基础上可以继续切片 alpha_aprt[1:][:2] #return ['d', 'e'] |
成员关系操作(in,not in)和重复操作"*“
用法固定,这里不再赘述
连接操作
前面的例子中演示过‘+’操作,此外可以使用extend()方法进行连接,以保证确实把新列表添加在了原有列表之中,而不是创建新的
|
1
2
3
4
|
origin = [1, 2, 4] newList = [9, 8, 8] origin.extend(newList) origin #return [1, 2, 4, 9, 8, 8] |
6.内建函数
标准内建函数cmp()
前面刚刚说了,cmp()的比较方式和使用比较运算符(<,<=,>,>=,==,!=)是一样的,都是:两个列表的元素依次比较,直到有一方胜出。比较过程中,如果比较对象是不同类型,则要进行类型转换,你不应该完全依赖这些自动的类型转换,在进行比较之前,你应该保证对象的一致性,更重要的,这样的比较应该有意义。cmp()返回值为:1,0,-1
序列类型函数
len(), max(), min(), sorted(), reversed(), enumerate(), zip(), sum()——这些函数的用法前面已经讲过,这里不再重复,挑几个特殊的说一下:
|
1
2
3
4
5
6
7
8
9
|
#sorted()返回一个新创建的列表对对象 listDemo = [1, 5, 4, 'A'] type(sorted(listDemo)) #return <type 'list'> #reversed()返回的是一个迭代器类型对象!! type(reversed(listDemo)) #return <type 'listreverseiterator'> #sum()作用于列表时,要求列表的元素都是数字类型 sum(listDemo) #return a error |
迭代器的概念在后续的学习中会讲到,先明确它和列表对象有本质的区别!
list()函数是一个工厂函数,可以生产列表,同时可用于其它类型序列”转换“为列表,最后一个例子通过一个元组生产了一个列表:
|
1
2
3
4
5
|
list1 = list() #retur an empty list list2 = list(['a', 'b', 'c']) #produce a list list3 = list('abc') list3 #return ['a', 'b', 'c'] list4 = list(('a', 'b', 'c')) # ret ['a', 'b', 'c'] |
7.列表类型的内建函数
以下介绍列表类型自己的方法,你可以通过dir(list)浏览所有的方法,继而通过help(list.method_name)或者help(list.method_name)或者list.method_name.__doc__的方式获取帮助信息。
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#列表类型内建函数 ''' list.append(obj) 向列表中追加一个对象 list.count(obj) 返回对象obj在列表中出现的次数 list.extend(seq) 把序列seq的内容添加到列表中 list.insert(index,obj) 在列表索引为index的位置插入对象obj list.index(obj, i=0, j=len(list)) 返回列表中索引值在i和j之间的元素值为obj的所有索引 list.pop(index = -1) 删除列表中索引为index的元素并将其返回 list.remove(obj) 从列表中删除对象obj list.reverse() 原地翻转列表 list.sort(fun=None, key=None, reverse=False) 以指定的方式对列表排序,具体请help ''' |
需要指出的几点:
-
使用index内建方法时,如果找不到obj,会返回一个错误,这是你不乐意的,所以在返回其位置前,先用in或者not in成员关系操作符检查一下,因index方法默认认为要找的对象是一定存在的。
-
那些可以改变对象值的对象方法是没有返回值的,如sort(),reversed(),因它们作用在对象自身身上,不会返回新的对象。
-
extend()方法过去只能接受一个列表并将其追加到原列表中,现在可以支持任何可迭代对象,包括:元组,字符串,迭代器等
二、列表的典型应用:堆栈,队列
1.堆栈(Stack)
堆栈是一个后进先出(Last In First Out,LIFO)的数据结构,就像玩汉诺塔一样,最后放上去的盘子总是可以先拿下来,最先放上去的要最后拿下来;或者像我们穿衣服,最先穿上的,你总是最后才能脱下来:-)。在C++中,堆栈可以用vector容器构造出来,在Python中,使用Python构造堆栈更加容易和灵活:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
|
#!/usr/bin/env python ''' stack_demo.py --- list based stack function ''' stack = [] #create an empty stack def pushit(): #入栈函数 stack.append(raw_input('Enter New String: ').strip()) def popit(): #出栈函数,strip可以去掉字符串两端的空白 if len(stack) == 0: print 'Cannot pop from an empty stack!' else: print "Removed ['%s']" % stack.pop() def viewstack(): #显示堆栈内容 print stack #calls str() internally #define key to function commands CMDs = {'u':pushit, 'o':popit, 'v':viewstack} def showmenu(): print ''' p(U)sh p(O)p (V)iew (Q)uit Enter choice: ''', #main loop begin! while True: while True: try: showmenu() choice = raw_input('') except (EOFError, KeyboardInterrupt, IndexError): choice = 'q' print '\n You picked: [%s]' % choice if choice not in 'uovq': print 'Invalid option, try again' else: break if choice == 'q': break CMDs[choice]() #powerful usage of function and dict! |
这段代码是有重大bug的,如果你输入'uo',则会出现异常,因上述代码是假定用户会听话的每次输入一个字符,你可以对其进行改进。内层循环用于获取“合理”的命令“键“,外层循环负责将”键“通过字典映射到函数,怎么样,很简单吧?
2.队列(Queue)
队列是一种先进先出(First In First Out,FIFO)结构,这比堆栈要容易理解多了,因为生活中处处都有队列,在ATM或银行柜台前排队,超市结账口,KFC点菜口等等,总之,先来先享受服务,后来的老老实实排队(当然,如果你有关系可以走后门的话那就另当别论了)。
将上面的堆栈代码修改成队列代码太简单了,先将所有的stack替换成queue,然后修改进队和出队函数,保证出去的是第一个进去的,新加入的排最后,此外再做一些微小的改动:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
|
#!/usr/bin/env python ''' queue_demo.py --- list based queue function ''' queue = [] #create an empty queue def EnQ(): #入队函数 queue.append(raw_input('Enter New String: ').strip()) def DeQ(): #出队函数,strip可以去掉字符串两端的空白 if len(queue) == 0: print 'Cannot pop from an empty queue!' else: print "Removed ['%s']" % queue.pop(0) def viewqueue(): #显示队列内容 print queue #calls str() internally #define key to function commands CMDs = {'e':EnQ, 'd':DeQ, 'v':viewqueue} def showmenu(): print ''' (E)nQ (D)eQ (V)iew (Q)uit Enter choice: ''', #main loop begin! while True: while True: try: showmenu() choice = raw_input('').strip().lower() except (EOFError, KeyboardInterrupt, IndexError): choice = 'q' print '\n You picked: [%s]' % choice if choice[0] not in 'edvq': print 'Invalid option, try again' else: break if choice[0] == 'q': break CMDs[choice[0]]() #powerful usage of function and dict! |
这段代码解决了上个代码的Bug,首先在36行,对读入的命令用strip()去掉两端的空格,继而用lower()将其全部转化为小写,在41,46,48行,我们取choice[0]进行比较,即如果用户键入多个字符的话,我们认为第一个是有效的。但是,这样并不完美,我们不应该让用户关注大小写,也就是说,输入q和Q应该是等价的。你可以继续修改,直至作为“用户”的你可以满意。
三、元组
元组是一种和列表大不相同却又有太多相似之处的容器类型。不同之处很明显,元组用圆括号包裹,是一种不可更改的容器。因此它能用来做一些列表不能做的事,如用作一个字典的key。相同之处在于它们在操作和使用上很大程度是相似的,所以,这一节将着重描述元组和列表的不同之处。
1.创建
列表用“[]”者工厂函数list(),元组用“()"或工厂函数tuple()
2.访问
使用下标或者切片方式访问,和列表相同
3.更新(这是不可以的!)
|
1
2
3
4
|
tuple_demo = (1, 2, 4) tuple_demo[0] = 9 #retun an error!! tuple_demo = (9, 2, 4) |
千万别认为在第四行你将对象更新了,这只是让tuple_demo指向了一个新的对象!不信的话用id()测试一下。总之,记住,元组类型不能更新。
特殊情况:如果元组的某个成员是列表,那么这个成员的成员是可以变更的:
|
1
2
|
a = (1, 2, 3, 4, ['a', 'b']) a[4][1] = 'byte' # this is proved! |
注意,这里并没有违反元组不可更新的原则,我们更改的是一个列表对象,可以这样认为:这个元组里面的第4号元素是到列表对象的引用,我们并没有更新这个引用!
4.删除
你不能删除一个元素,你只可以删除元组本身。 del tuple_name
5.操作符和内建函数
元组没有自己专用的操作符和内建函数,可能是缘于其是不可变量吧,内建方法也就被省了,这对我们来说并非坏事,减轻了我们学习的负担。
至于重复,连接,比较等操作,和列表一样,这里不再重复。
6.默认集合类型
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#所有多对象,逗号分隔的,没有明确用符号定义的集合都是元组类型 >>>'abc', 23, 234.5('abc', 23, 234.5) >>>x, y = 1, 4>>>x, y (1, 4) #返回多对象的函数返回元组类型 def fool(): ... return obj1, obj2, obj3 var1, var2, var3 = fool() |
7.单元素元组
|
1
2
|
single_tuple = ('xyz',) #别忘了这个逗号,否则不会得到你想要的 single_list = ['xyz'] #对于列表就不存在这个问题 |
8.真的需要元组吗?
元组的存在关键在于其不可变,有时我们维护一组敏感数据,需要将它作为参数传递给不熟悉甚至不是自己写的API,为了保护数据不会被调用的函数篡改,这时候元组便派上用场了。tuple()和list()两个函数可以方便两种序列类型的转换,在参数传递的时候这便极为有用。
四、相关模块
|
1
2
3
4
5
6
7
8
9
10
11
|
#与序列类型相关的模块 print ''' array 受限制的序列类型,和数组一样,所以元素必须是同种类型 copy 提供浅拷贝和深拷贝能力 operator 包含函数调用形式的序列操作符 re Perl风格的正则表达式查找和匹配 StringIO 把长字符串作为文件来操作 cStringIO 把长字符串作为文件来操作,C版的,更快一些,不能被继承 textwrap 包装填充文本的函数 types 包含Python支持的所有类型 collections 高性能容器数据类型 ''' |
五、深拷贝和浅拷贝
Brown和Marry是一对夫妻,他们准备开两个银行账户,银行是这么做的:
|
1
2
3
|
husband = ['Brown', ['savings', 100]] wife = husband wife[0] = 'Marry' |
两个账户应该是相同的,因此wife = husband,后再改一下名字应该没有什么问题,但问题出现了!
|
1
2
|
>>>wife, huaband (['Marry', 'savings', 100], ['Marry', 'savings', 100]) |
名字成为了一样的!!(这时Brown先生表达了十分的不满)
深拷贝和浅拷贝(拷贝即copy)一定是针对容器类型而言的,对于非容器类型没有意义。在上例中,husband和wife实质上是指向同一对象的两个引用,因此更改一个就影响了“另一个”,其实是同一个。 这里拷贝给wife的只是引用,而不是对象,这样的拷贝称为浅拷贝。
银行马上做了改进:
|
1
2
3
4
5
6
7
8
9
10
|
person = ['name', ['savings', 0]] husband = person[:] #slice copy wife = list(person) #factory function copy husband[0] = 'Brown' #change name husband[1][1] = 100 #to save 100 dollar wife[0] = 'Marry' #change name wife[1][1] = 100 #to save 100 dollar |
这下应该没问题了吧,使用了切片方法和工厂方法,应该是创建了两个不同的对象的,再也不会有冲突了!?
一天,Brown先生发了奖金,为了存点私房钱,他没有上交夫人,而是存了起来:
|
1
|
husband[1][1] += 1000 |
奇怪的是,Marry夫人在ATM上查询自己的余额时,发现自己的账户多了1000 dollar!
|
1
2
|
>>>wife ['Marry', ['savings', '1100']] |
和丈夫谈起这件怪事时,丈夫觉得有问题,于是和妻子到银行去咨询,结果可想而知,那1000 d居然是Brown先生的私房钱。(Marry很生气,但又很高新,因为“公共账户”对她来说挺好的,可以了解丈夫的财务情况,但Brown不满意,毕竟作为一个男人,没有些自己的“私房钱”总是不那么光彩)。
无论是切片方法还是工厂方法,这里做的都是浅拷贝,虽然wife和husband确实指向两个不同的对象,但这两个对象中的那个列表仍然是同一个列表对象,即两个对象中是同一个列表对象的引用,这就是上面问题的原因。
解决问题的方法是深度拷贝,使用copy模块的deepcopy方法:
|
1
2
3
4
5
6
7
8
9
|
import copy person = ['name', ['savings', 0]] wife = copy.deepcopy(person) husband = copy.deepcopy(person) wife[0] = 'Marry'wife[1][1] += 1000... husband[1][1] += 500 |
现在,wife和husband确实是两个不同的对象,而且其内部列表也确实指向了两个不同的列表,两个账户终于实现了私有化,这才是Brown先生想看到的!
问题最终解决了,Brown先生真诚的向夫人道了歉,Marry夫人也并非那么小心眼儿,生活回到了往日的平静......
六、小结
字符串、列表、元组以及我们下一节要学习的字典、集合是Python中最重要的几种数据类型,熟练掌握它们是使用Python进行程序设计的关键,多写一写,看一看,相信对你来说,一定会很简单,原因很简单:This is Python!

浙公网安备 33010602011771号