记录我的 python 学习历程-Day06 is id == / 代码块 / 集合 / 深浅拷贝

一、is == id 用法

  在Python中,id是内存地址, 你只要创建一个数据(对象)那么就会在内存中开辟一个空间,将这个数据临时加载到内存中,这个空间有一个唯一标识,就好比是身份证号,标识这个空间的叫做内存地址,也就是这个数据(对象)的id,那么你可以利用id()去获取这个数据的内存地址:

name = 'Dylan'
print(id(name))	# 4319709032

​ == 是比较两边的数值是否相等,其反回的结果是 True 或 False。

​ is 是比较两边的内存地址是否相等,如果内存地址相等,那么两边所指向是同一个内存地址。其反回的结果是 True 或 False。

name = ['Dylan']
name2 = ['Dylan']
print(name is name2)	# False
print(name == name2)	# True
print(id(name))			# 4387384328
print(id(name2))		# 4387382920

# 这里表示:name name2数值是一样的,但却不是同一个内存地址。

​ 所以:如果内存地址相同,那么值肯定相同,但是如果值相同,内存地址不一定相同。

二、代码块

  • Python 程序是由代码块构造的,块是一个 python 程序的文本,他是作为一个单元执行的。

    代码块:一个模块、一个函数、一个类、一个文件等都是一个代码块。

  • 作为交互方式输入的每个命令都是一个代码块。

    什么是交互方式?

    就是咱们在 cmd 中进入 Python 解释器里面,每一行代码都是一个代码块。

三、同一代码块下的缓存机制

  • 前提条件:同一个代码块内。
  • 机制内容:Python在执行同一个代码块的初始化对象的命令时,会检查是否其值是否已经存在,如果存在,会将其重用。换句话说:执行同一个代码块时,遇到初始化对象的命令时,他会将初始化的这个变量与值存储在一个字典中,在遇到新的变量时,会先在字典中查询记录,如果有同样的记录那么它会重复使用这个字典中的之前的这个值。所以在你给出的例子中,文件执行时(同一个代码块)会把i1、i2两个变量指向同一个对象,满足缓存机制则他们在内存中只存在一个,即:id相同。
  • 适用对象:int(float)、bool、str。
  • 具体细则:
    • int(float):任何数字在同一代码块下都会复用。
    • bool:True 和 False 在字典中会以1,0的方式存在,并且复用。
    • str:几乎所有的字符串都会符合缓存机制。
  • 优点:提升性能,节省内存。

不同代码块下的缓存机制(小数据池)

  • 前提条件:不同代码块内。

  • 机制内容:Python自动将-5~256的整数进行了缓存,当你将这些整数赋值给变量时,并不会重新创建对象,而是使用已经创建好的缓存对象。

    python会将一定规则的字符串在字符串驻留池中,创建一份,当你将这些字符串赋值给变量时,并不会重新创建对象, 而是使用在字符串驻留池中创建好的对象。

      其实,无论是缓存还是字符串驻留池,都是python做的一个优化,就是将~5-256的整数,和一定规则的字符串,放在一个‘池’(容器,或者字典)中,无论程序中那些变量指向这些范围内的整数或者字符串,那么他直接在这个‘池’中引用,言外之意,就是内存中之创建一个。

  • 适用对象:int(float)、bool、str。

  • 具体细则:

    • int(float):那么大家都知道对于整数来说,小数据池的范围是-5~256 ,如果多个变量都是指向同一个(在这个范围内的)数字,他们在内存中指向的都是一个内存地址。
    • bool:True 和 False 在字典中会以1,0的方式存在,并且复用。
    • str:满足规则的字符串。
  • 优点:提升性能,节省内存。

  • 总结:

    • 面试题考。
    • 回答的时候一定要分清楚:同一个代码块下适用一个缓存机制。不同的代码块下适用另一个缓存机制(小数据池)
    • 小数据池:数字的范围是-5~256.
    • 缓存机制的优点:提升性能,节省内存。

四、集合(了解)

​ 集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。

  • 集合最重要的两点:

    • 去重,把一个列表变成集合,就自动去重了。
    • 关系测试,测试两组数据之前的交集、差集、并集等关系。
  • 集合和字典

    • 集合的创建

      # 方法一
      set1 = set({'name', 'Dyaln', 'age', 111, 434})
      # 方法二
      set1 = {'name', 'Dyaln', 'age', 111, 434}
      
    • 字典和集合的格式:

      # 字典
      dic = {'name':'Dylan', 'age': 18}
      # 集合
      set1 = {'name', 'age', 18, False, True, }
      
    • 空字典:

      dic = {}
      # 或者
      {}
      print({}, type({}))		# {} <class 'dict'>
      
    • 空集合:

      set()
      print(set(), type(set()))		# set() <class 'set'>
      
    • 集合的有效性:

      set1 = {[1, 3, 5], 3, {'name': 'Dylan'}}
      print(set1)		
      # 报错
        File "/Users/yaoyaoba/Full_stack_22/day06/练习.py", line 24, in <module>
      set() <class 'set'>
          set1 = {[1, 3, 5], 3, {'name': 'Dylan'}}
      TypeError: unhashable type: 'list'
      # 集合内的元素必须是 可合希类型(不可变数据类型)
      
  • 集合的操作

      • set.add()

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        set1.add('xx')
        print(set1)		# {'xiaowang', 'xx', 'age', 'yaoyao', 'name', 'Dylan'}
        
      • set.update() 迭代增加(有重复的会自动除去)

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        set1.update('abcdedfdaefdafdsa')
        print(set1) 	# {'yaoyao', 'age', 'd', 'e', 'a', 'Dylan', 'xiaowang', 'b', 'f', 'c', 'name', 's'}
        
      • set.remove() 按元素删除

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        set1.remove('age')
        print(set1) 	# {'xiaowang', 'yaoyao', 'Dylan', 'name'}
        
      • set.pop() 随机删除

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        set1.pop()
        print(set1) 	 # {'yaoyao', 'age', 'xiaowang', 'Dylan'}
        
      • set.clear() 清空集合

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        set1.clear()
        print(set1) 	# set()
        
      • del set 删除集合

        set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}
        del set1
        print(set1) 	# 会报错,因为己经没有这个集合了
        # 报错信息如下:
        Traceback (most recent call last):
          File "/Users/yaoyaoba/Full_stack_22/day06/练习.py", line 28, in <module>
            print(set1) 	# 会报错,因为己经没有这个集合了
        NameError: name 'set1' is not defined
        
    • 集合的其它操作

      • 交集。(& 或者 intersection)

        set1 = {1, 2, 3, 4, 5}
        set2 = {4, 5, 6, 7, 8}
        print(set1 & set2) 	# {4, 5}
        
      • 并集。(| 或者 union)

        set1 = {1, 2, 3, 4, 5}
        set2 = {4, 5, 6, 7, 8}
        print(set1 | set2) 	# {1, 2, 3, 4, 5, 6, 7, 8} 
        
      • 差集。(- 或者 difference)

        set1 = {1, 2, 3, 4, 5}
        set2 = {4, 5, 6, 7, 8}
        print(set1 - set2) 	# {1, 2, 3} 
        
      • 反交集。 (^ 或者 symmetric_difference)

        set1 = {1, 2, 3, 4, 5}
        set2 = {4, 5, 6, 7, 8}
        print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}
        
      • 子集与超集

        set1 = {1,2,3}
        set2 = {1,2,3,4,5,6}
        
        print(set1 < set2)
        print(set1.issubset(set2))  # 这两个相同,都是说明set1是set2子集。
        
        print(set2 > set1)
        print(set2.issuperset(set1))  # 这两个相同,都是说明set2是set1超集。
        
      • 列表去重

         l1 = [1,'Dylan', 1, 2, 2, 'Dylan',2, 6, 6, 3, 'Dylan', 4, 5]
        # set1 = set(l1)
        # l1 = list(set1)
        # print(l1)
        
        # 用处:数据之间的关系,列表去重。
        

五、深浅copy

​ copy其实就是复制一份,也就是所谓的抄一份。深浅copy其实就是完全复制一份,和部分复制一份的意思。

  • 先看赋值运算

    l1 = [1, 2, 3, ['Dylan', 'age']]
    l2 = l1
    l1.append(456)
    print(l1)	# [1, 2, 3, ['Dylan', 'age'], 456]
    print(l2)	# [1, 2, 3, ['Dylan', 'age'], 456]
    print(id(l1))	# 4387382920 内存地址是一样的
    print(id(l2))	# 4387382920 内存地址是一样的
    

    对于赋值运算来说,l1与l2指向的是同一个内存地址,所以它们是完全一样的,l1,l2指向的是同一个列表,任何一个变量对列表进行改变,剩下那个变量在使用列表之后,这个列表就是发生改变之后列表。

  • 浅拷贝 copy

    l1 = [1, 2, 3, ['Dylan', 'age']]
    l2 = l1.copy()
    print(id(l1))	# 4335892104
    print(id(l2))	# 4335903304
    # 这说明,通过 copy 出来的新列表,在内存中又开辟了一块新的内存空间,两者间不是指向的同一个列表。
    # 但是,如果再做如下操作你会发现什么?
    
    print(id(l1[-1])) 	# 4370607112
    print(id(l2[-1]))	# 4370607112
    # 你会发现,咦?内存地址是一样的,说明是同一个数据。
    

    由此我们可以得知,浅拷贝其实只是拷贝了一个列表的外壳。

    对于浅copy来说,只是在内存中重新创建了开辟了一个空间存放一个新列表,但是新列表中的元素与原列表中的元素是公用的。

    这里还有一个问题:

    当改变列表中的不可变数据类型时,新列表中的内容是不会一同被更改的,因为它是可哈希数据类型,如列表中,可变数据类型被列改或增删改,则新列表会一同更改。

  • 深拷贝 deepcopy

    import copy
    l1 = [1, 2, 3, ['Dylan', 'age']]
    l2 = copy.deepcopy(l1)
    print(id(l1))	# 4343088456
    print(id(l2))	# 4370618248
    # 这说明,通过 copy 出来的新列表,在内存中又开辟了一块新的内存空间,两者间不是指向的同一个列表。
    
    print(id(l1[-1])) 	# 4379005512
    print(id(l2[-1]))	# 4379005832
    # 咦?内存地址不一样了,说明不是同一个数据了。
    
    print(id(l1[0])) 	# 4305226112
    print(id(l2[0]))	# 4305226112
    # 哎我去!又一样了,咋回事儿?
    

    深 copy 的特性就是将可变的数据类型在内存中重新创建一份,而不可变的数据类型则沿用之前的。

    但,同样如浅拷贝那样,不可变的数据类型,即便内存地址相同,当你改变他时,新列表也不会一同被更改,只因为他是不可变数据类型(可哈希)。

  • 相关面试题

    l1 = [1, 2, 3, [22, 33]]
    l2 = l1[:]
    l1[-1].append(666)
    print(l1)	# [1, 2, 3, [22, 33, 666]]
    print(l2)	# [1, 2, 3, [22, 33, 666]]
    浅copy: list dict: 嵌套的可变的数据类型是同一个。
    深copy: list dict: 嵌套的可变的数据类型不是同一个 。
    
posted @ 2019-12-16 01:19  Dylan_Yu  阅读(225)  评论(0编辑  收藏  举报