python知识深入了解

python知识深入了解

1 全局解释器锁(GIL)

不是python的特性

描述Python GIL的概念, 以及它对python多线程的影响?

编写一个多线程抓取网页的程序,并阐明多线程抓取程序是否可比单线程性能有提升,并解释原因。

  1. Python语言和GIL没有任何关系。仅仅是由于历史原因在Cpython虚拟机(解释器),难以移除GIL。(java编写的python解释器不存在这个问题)

  2. GIL:全局解释器锁。每个线程在执行的过程都需要先获取GIL,保证同一时刻只有一个线程可以执行代码。

  3. 线程释放GIL锁的情况: 遇到IO阻塞时,可以暂时释放GIL。

  4. Python使用多进程是可以利用多核的CPU资源的。

  5. 多线程爬取比单线程性能有提升,因为遇到IO阻塞会自动释放GIL锁

解决GIL的两种方法:使用其他语言编写的解释器、使用其他语言编写多线程、使用多进程

2 深拷贝和浅拷贝

  • copy.copy()

​ 浅拷贝是对一个对象的顶层(外层)拷贝,只是拷贝了引用,并没有拷贝内容。

​ 变量的赋值是地址的引用,也算是一种浅拷贝。

  • copy.deepcopy()

​ 深拷贝则是对一个对象深层(递归)的拷贝。

可变类型:列表、字典

不可变类型:数字类型、字符串型、元组

如果是可变类型,浅拷贝只拷贝外层的引用,而深拷贝是完全拷贝

如果是纯的不可变类型,那么无论是浅拷贝还是深拷贝,都只是指向同一个地址。

如果不可变类型里面还存在可变类型,则浅拷贝是指向,而深拷贝则为完全拷贝。

  • 对于不可变类型的数据

    浅拷贝或者深拷贝都是拷贝的引用

  • 对于可变类型的数据

    • 浅拷贝: 拷贝的是最顶层的对象的引用
    • 深拷贝: 最顶层的数据中,可变类型数据拷贝的是对象,不可变类型拷贝的是引用

切片、字典拷贝和copy.copy()一样,都是浅拷贝

对不可变类型和可变类型的copy不同:

  1. copy.copy对于可变类型,会进行浅拷贝。

  2. copy.copy对于不可变类型,不会拷贝,仅仅是指向。

  3. copy.deepcopy对于全部是不可变类型的数据,也不会拷贝,仅仅是指向

copy.copy和copy.deepcopy的区别:

  1. copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象

  2. copy.deepcopy 深拷贝 拷贝对象及其子对象

3 私有化

变量形式 说明
xx 公有变量
_xx 单前置下划线,私有属性或方法,from 模块 inport *禁止导入这类变量,类对象或子类可以访问
__xx 双前置下划线,私有化属性或方法,避免与子类中的属性名冲突,无法在外部直接访问
__xx__ 双前后置下划线,魔法属性或方法。 例如:__init__
xx_ 单后置下划线,用于避免与python关键字冲突,不推荐使用

4 模块搜索顺序

import sys # 导入模块

# 返回查找模块的列表目录,列表中的路径的先后顺序代表了python解释器在搜索模块时的先后顺序。第一个元素返回的是一个空字符串表示当前目录。
print(sys.path)

# 在列表最后追加搜索目录
sys.path.append('/home/itcast/xxx') 
# 可以确保先搜索这个路径
sys.path.insert(0, '/home/itcast/xxx') 

5 重新导入模块

from imp import reload

reaload(模块名)

6 继承、封装和多态

封装就是把方法和属性封装到类的内部,只需要在类的外部,通过对象即可调用。

继承实现了代码的重用。子类可以继承父类,并且可以继承多个父类即多继承,子类可以使用父类所拥有的属性和方法(除了私有属性和方法)。

多态是以继承和重写父类方法为前提,增加了代码的灵活度,只是一种调用技巧。

7 MRO顺序

多继承是指子类继承了多个父类,可以通过三种方法调用父类的方法:

  1. 父类.父类中的方法(self):这种方法容易造成父类中的方法被多次调用,而且父类中的方法一旦改变子类中的方法也要改变。

  2. super(指定某个类名, self).父类方法():从指定类名的MRO顺序下一级开始调用。

  3. super().父类中方法():从当前类的mro顺序开始调用父类中方法。

mro:方法解析顺序 Method Resolution Order

通过class.__mro__查看当前类的mro调用顺序

说明:

​ 单继承使用哪一种方法都可以,基本上无差别,但是建议使用super()方法。单继承中只需要传父类参数,多继承需要传全部的参数。

8 实例方法、类方法和静态方法的区别

  • 这三种方法都封装在类的内部,调用者不同。
    • 实例方法是由实例对象调用,至少有一个参数self
    • 类方法是由类对象调用,类方法需要classmothed修饰器修饰。
    • 静态方法由类对象调用,不需要参数,需要staticmothed修饰器修饰。

注意:区别从调用者、参数和是否需要修饰器修饰三个方面入手

9 property属性

property属性:一种用来像是使用实例属性一样的特殊属性,可以应用于某个方法。

实现property属性的两种方法:修饰器、类属性

修饰器:经典类中,只有property修饰器即@property。新式类有三类即@property@方法.setter@方法.deleter,分别是取值、修改、删除。

类属性:通过类属性实现property属性时,经典类和新式类无差别,property()中有四个参数,前三个是方法(取值、修改、删除),第四个参数是字符串

property方法中有个四个参数:

​ 第一个参数是方法名,调用 对象.属性 时自动触发执行方法

​ 第二个参数是方法名,调用 对象.属性 = XXX 时自动触发执行方法

​ 第三个参数是方法名,调用 del 对象.属性 时自动触发执行方法

​ 第四个参数是字符串,调用 对象.属性._doc_ ,此参数是该属性的描述信息

10 常见的魔方属性、方法

__doc__ 表示类的描述信息

__module__ 表示当前操作的对象在那个模块

__class__ 表示当前操作的对象的类是什么

__new__ 创建对象时为对象分配空间,在初始化方法__init__之前被调用

__init__ 初始化方法,通过类创建对象时,自动触发执行

__del__ 当对象在内存中被释放时,自动触发执行

__call__ 对象后面加括号,触发执行,例如对象()或者类名()()

__dict__ 类或对象中的所有属性

__str__ 在打印对象时,默认输出该方法的返回值(自定义字符串)

11 with与上下文管理器

任何实现了 __enter__()__exit__() 方法的对象都可称之为上下文管理器,上下文管理器对象可以使用 with 关键字。

Python 还提供了一个 contextmanager 的装饰器,更进一步简化了上下文管理器的实现方式。通过 yield 将函数分割成两部分,yield 之前的语句在 enter 方法中执行,yield 之后的语句在 exit 方法中执行。紧跟在 yield 后面的值是函数的返回值。

posted @ 2022-07-27 15:17  三叶草body  阅读(88)  评论(0)    收藏  举报