day10+作业
集合
1 # 1、作用 2 # 1.1 关系运算 3 # friends1 = ["zero","kevin","jason","egon"] 4 # friends2 = ["Jy","ricky","jason","egon"] 5 # 6 # l=[] 7 # for x in friends1: 8 # if x in friends2: 9 # l.append(x) 10 # print(l) 11 12 13 # 1.2、去重 14 15 16 # 2、定义: 在{}内用逗号分隔开多个元素,多个元素满足以下三个条件 17 # 1. 集合内元素必须为不可变类型 18 # 2. 集合内元素无序 19 # 3. 集合内元素没有重复 20 21 # s={1,2} # s=set({1,2}) 22 23 # s={1,[1,2]} # 集合内元素必须为不可变类型 24 # s={1,'a','z','b',4,7} # 集合内元素无序 25 # s={1,1,1,1,1,1,'a','b'} # 集合内元素没有重复 26 # print(s) 27 28 # 了解 29 # s={} # 默认是空字典 30 # print(type(s)) 31 # 定义空集合 32 # s=set() 33 # print(s,type(s)) 34 35 # 3、类型转换 36 # set({1,2,3}) 37 # res=set('hellolllll') 38 # print(res) 39 40 print(set([1,1,1,1,1,1])) 41 # print(set([1,1,1,1,1,1,[11,222]]) 42 43 # print(set({'k1':1,'k2':2})) 44 45 # 4、内置方法 46 # =========================关系运算符========================= 47 friends1 = {"zero","kevin","jason","egon"} 48 friends2 = {"Jy","ricky","jason","egon"} 49 50 # 4.1 取交集:两者共同的好友 51 res=friends1 & friends2 52 print(res) 53 print(friends1.intersection(friends2)) 54 # 4.2 取并集/合集:两者所有的好友 55 print(friends1 | friends2) 56 print(friends1.union(friends2)) 57 58 # 4.3 取差集:取friends1独有的好友 59 # print(friends1 - friends2) 60 # print(friends1.difference(friends2)) 61 62 # 取friends2独有的好友 63 # print(friends2 - friends1) 64 # print(friends2.difference(friends1)) 65 66 # 4.4 对称差集: 求两个用户独有的好友们(即去掉共有的好友) 67 # print(friends1 ^ friends2) 68 # print(friends1.symmetric_difference(friends2)) 69 70 # 4.5 父子集:包含的关系 71 # s1={1,2,3} 72 # s2={1,2,4} 73 # 不存在包含关系,下面比较均为False 74 # print(s1 > s2) 75 # print(s1 < s2) 76 77 # s1={1,2,3} 78 # s2={1,2} 79 # print(s1 > s2) # 当s1大于或等于s2时,才能说是s1是s2他爹 80 # print(s1.issuperset(s2)) 81 # print(s2.issubset(s1)) # s2 < s2 =>True 82 83 # s1={1,2,3} 84 # s2={1,2,3} 85 # print(s1 == s2) # s1与s2互为父子 86 # print(s1.issuperset(s2)) 87 # print(s2.issuperset(s1)) 88 89 90 # =========================去重========================= 91 # 1、只能针对不可变类型去重 92 # print(set([1,1,1,1,2])) 93 94 # 2、无法保证原来的顺序 95 # l=[1,'a','b','z',1,1,1,2] 96 # l=list(set(l)) 97 # print(l) 98 99 100 # l=[ 101 # {'name':'lili','age':18,'sex':'male'}, 102 # {'name':'jack','age':73,'sex':'male'}, 103 # {'name':'tom','age':20,'sex':'female'}, 104 # {'name':'lili','age':18,'sex':'male'}, 105 # {'name':'lili','age':18,'sex':'male'}, 106 # ] 107 # new_l=[] 108 # for dic in l: 109 # if dic not in new_l: 110 # new_l.append(dic) 111 112 # print(new_l) 113 114 # 其他操作 115 # ''' 116 # # 1.长度 117 # >>> s={'a','b','c'} 118 # >>> len(s) 119 # 3 120 # 121 # # 2.成员运算 122 # >>> 'c' in s 123 # True 124 # 125 # # 3.循环 126 # >>> for item in s: 127 # ... print(item) 128 # ... 129 # c 130 # a 131 # b 132 # ''' 133 134 # 其他内置方法 135 s={1,2,3} 136 # 需要掌握的内置方法1:discard 137 s.discard(4) # 删除元素不存在do nothing 138 print(s) 139 s.remove(4) # 删除元素不存在则报错 140 141 142 # 需要掌握的内置方法2:update 143 # s.update({1,3,5}) 144 # print(s) 145 146 # 需要掌握的内置方法3:pop 147 # res=s.pop() 148 # print(res) 149 150 # 需要掌握的内置方法4:add 151 # s.add(4) 152 # print(s) 153 154 155 156 # 其余方法全为了解 157 # res=s.isdisjoint({3,4,5,6}) # 两个集合完全独立、没有共同部分,返回True 158 # print(res) 159 160 # 了解 161 # s.difference_update({3,4,5}) # s=s.difference({3,4,5}) 162 # print(s)
字符编码
1 分析过程 2 3 x="上" 4 5 内存 6 上-------翻译-----》0101010 7 上《----翻译《-----0101010 8 9 字符编码表就是一张字符与数字对应关系的表 10 11 12 a-00 13 b-01 14 c-10 15 d-11 16 17 ASCII表: 18 1、只支持英文字符串 19 2、采用8位二进制数对应一个英文字符串 20 21 GBK表: 22 1、支持英文字符、中文字符 23 2、 24 采用8位(8bit=1Bytes)二进制数对应一个英文字符串 25 采用16位(16bit=2Bytes)二进制数对应一个中文字符串 26 27 28 unicode(内存中统一使用unicode): 29 1、 30 兼容万国字符 31 与万国字符都有对应关系 32 2、 33 采用16位(16bit=2Bytes)二进制数对应一个中文字符串 34 个别生僻会采用4Bytes、8Bytes 35 36 37 unicode表: 38 内存 39 人类的字符---------unicode格式的数字---------- 40 | | 41 | | 42 | 43 硬盘 | 44 | 45 | | 46 | | 47 GBK格式的二进制 Shift-JIS格式的二进制 48 49 老的字符编码都可以转换成unicode,但是不能通过unicode互转 50 51 52 53 utf-8: 54 英文->1Bytes 55 汉字->3Bytes 56 57 58 59 结论: 60 1、内存固定使用unicode,我们可以改变的是存入硬盘采用格式 61 英文+汉字-》unicode-》gbk 62 英文+日文-》unicode-》shift-jis 63 万国字符》-unicode-》utf-8 64 65 2、文本文件存取乱码问题 66 存乱了:解决方法是,编码格式应该设置成支持文件内字符串的格式 67 取乱了:解决方法是,文件是以什么编码格式存如硬盘的,就应该以什么编码格式读入内存 68 69 70 71 3、python解释器默认读文件的编码 72 python3默认:utf-8 73 python2默认:ASCII 74 75 指定文件头修改默认的编码: 76 在py文件的首行写: 77 #coding:gbk 78 79 4、保证运行python程序前两个阶段不乱码的核心法则: 80 指定文件头 81 # coding:文件当初存入硬盘时所采用的编码格式 82 83 84 5、 85 python3的str类型默认直接存成unicode格式,无论如何都不会乱码 86 保证python2的str类型不乱码 87 x=u'上' 88 89 90 6、了解 91 python2解释器有两种字符串类型:str、unicode 92 # str类型 93 x='上' # 字符串值会按照文件头指定的编码格式存入变量值的内存空间 94 # unicode类型 95 x=u'上' # 强制存成unicode
作业
1 # 一.关系运算 2 # 有如下两个集合,pythons是报名python课程的学员名字集合,linuxs是报名linux课程的学员名字集合 3 pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'} 4 linuxs={'wupeiqi','oldboy','gangdan'} 5 # 1. 求出即报名python又报名linux课程的学员名字集合 6 print(pythons&linuxs) 7 # 2. 求出所有报名的学生名字集合 8 print(pythons|linuxs) 9 # 3. 求出只报名python课程的学员名字 10 print(pythons-linuxs) 11 # 4. 求出没有同时这两门课程的学员名字集合 12 print(pythons^linuxs) 13 # 14 # 二.去重 15 # 1. 有列表l=['a','b',1,'a','a'],列表元素均为可hash类型,去重,得到新列表,且新列表无需保持列表原来的顺序 16 # 17 l = ['a','b',1,'a','a'] 18 print(list(set(l))) 19 20 21 # 2.在上题的基础上,保存列表原来的顺序 22 # 23 lis = [] 24 for li in l: 25 if li not in lis: 26 lis.append(li) 27 else: 28 continue 29 print(lis) 30 # 3.去除文件中重复的行,肯定要保持文件内容的顺序不变 31 # 4.有如下列表,列表元素为不可hash类型,去重,得到新列表,且新列表一定要保持列表原来的顺序 32 # 33 l=[ 34 {'name':'egon','age':18,'sex':'male'}, 35 {'name':'alex','age':73,'sex':'male'}, 36 {'name':'egon','age':20,'sex':'female'}, 37 {'name':'egon','age':18,'sex':'male'}, 38 {'name':'egon','age':18,'sex':'male'}, 39 ] 40 lis = [] 41 for li in l: 42 if li not in lis: 43 lis.append(li) 44 else: 45 continue 46 print(lis)
浙公网安备 33010602011771号