返回顶部

python线程(二)代码部分Threading模块

一、threading类简介

1、threading.Thread类参数简介

class threading.Thread(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)

group:目前此参数为None,在实现ThreadGroup类时为将来的扩展保留。

target:target接收的是一个函数的地址,由run()方法调用执行函数中的内容。默认为无,表示未调用任何内容。

name :线程名,可自行定义。

args:target接收的是函数名,此函数的位置参数以元组的形式存放在args中,用于执行函数时调用。

kwargs :target接收的是函数名,此函数的关键字参数以字典的形式存放在kwargs中,用于执行函数时调用

daemon:如果为True表示该线程为守护线程。

2、threading.Thread类的常用方法

start():开启线程,一个Thread对象只能调用一次start()方法,如果在同一线程对象上多次调用此方法,则会引发RuntimeError。

run():执行start()方法会调用run(),该方将创建Thread对象时传递给target的函数名,和传递给args、kwargs的参数组合成一个完整的函数,并执行该函数。run()方法一般在自定义Thead类时会用到。

join(timeout=None):join会阻塞、等待线程,timeout单位为秒,因为join()总是返回none,所以在设置timeout调用join(timeout)之后,需要使用isalive()判断线程是否执行完成,如果isalive为True表示线程在规定时间内没有执行完,线程超时。如果join(timeout=None)则会等待线程执行完毕后才会执行join()后面的代码,一般用于等待线程结束。

name:获取线程名。

getName():获取线程名。

setName(name):设置线程名。

ident:“线程标识符”,如果线程尚未启动,则为None。如果线程启动是一个非零整数。

is_alive():判断线程的存活状态,在run()方法开始之前,直到run()方法终止之后。如果线程存活返回True,否则返回False。

daemon:如果thread.daemon=True表示该线程为守护线程,必须在调用Start()之前设置此项,否则将引发RuntimeError。默认为False

isDaemon():判断一个线程是否是守护线程。

setDaemon(daemonic):设置线程为守护线程。

 


 

二、threading.Thread的简单使用

 创建线程:

from threading import Thread

def work(args,kwargs=None):
    print(args)
    print(kwargs)

if __name__ == "__main__":
    t = Thread(target=work, args=(("我是位置参数"),), kwargs={'kwargs': '我是关键字参数'}, name='我是线程demo')
    print(t.name)  # 打印线程名
    t.start()          # 开启线程
    print('我是主线程')

# 打印内容如下
我是线程demo
我是位置参数
我是关键字参数
我是主线程

由上面的打印内容我们可以看出,在执行完所有线程后才执行的主线程print。如果是多进程的话会先执行主进程中的print然后才会执行子进程的print。主要是因为开启进程相比于开启线程更加耗费时间。

自定义线程类

from threading import Thread

def work(args,kwargs=None):
    print(args)
    print(kwargs)
class MyThread(Thread): # 使用继承Thread的方式,自定义线程类 def __init__(self,target=None, name=None, args=(), kwargs=None, *, daemon=None): # 如果要给对象封装属性,必须先调用父类 super().__init__() if kwargs is None: kwargs = {} self._target = target self._name = name self._args = args self._kwargs = kwargs def run(self): # 必须要有run类,因为start要调用 print(f"我重写了Thread类的run") self._target(*self._args,**self._kwargs) if __name__ == "__main__": t = MyThread(target=work,args=(('我是位置参数'),),kwargs={'kwargs':'我是关键字参数'},name='我是自定义线程类') # 创建线程对象 print(t.name) # 打印线程名 t.start() # 开启线程 print("主线程") # 打印内容如下 我是自定义线程类 我重写了Thread类的run 主线程 我是位置参数 我是关键字参数

多进程和多线程的效率对比

from threading import Thread
from multiprocessing import Process
import time

def thread_work(name):
    print(f"{name}")
def process_work(name):
    print(f"{name}")

if __name__ == "__main__":
    # 进程执行效率
    pro = []
    start = time.time()
    for i in range(3):
        p = Process(target=process_work,args=(("进程-"+str(i)),))
        p.start()
        pro.append(p)
    for i in pro:
        i.join()
    end = time.time()
    print("进程运行了:%s" %(end - start))
    # 线程执行效率
    thread_l = []
    start = time.time()
    for i in range(3):
        t = Thread(target=process_work, args=(("线程-" + str(i)),))
        t.start()
        thread_l.append(t)
    for i in thread_l:
        i.join()
    end = time.time()
    print("进程运行了:%s" % (end - start))

# 打印内容如下
进程-0
进程-1
进程-2
进程运行了:0.18501067161560059
线程-0
线程-1
线程-2
进程运行了:0.004000186920166016

我们可以从时间上看出,线程的效率是远远高于进程的。

守护线程

主线程会等待所有非守护线程执行完毕后,才结束主线程。主进程是进程内的代码结束后就结束主进程。

对比守护进程,代码执行完毕后立即关闭守护进程,因为在主进程看来代码执行完毕,主进程结束了,所以守护进程在代码结束后就被结束了。

守护线程会等待主线程的结束而结束。这是因为如果主线程结束意味着程序结束,主线程会一直等着所有非守护线程结束,回收资源然后退出程序,所以当所有非守护线程结束后,守护线程结束,然后主线程回收资源,结束程序。

下面对比守护进程和守护线程的示例:

先来看守护进程:

from multiprocessing import Process

def process_work(name):
    print(f"{name}")

if __name__ == "__main__":
    p = Process(target=process_work,args=("守护进程"))
    p.daemon=True
    p.start()
    print("主进程")

# 打印内容如下
主进程

只打印了主进程,也就是说守护进程还没来得及执行程序就结束了。

再来看守护线程:

from threading import Thread

def thread_work(name):
    print(name)

if __name__ == "__main__":
    t = Thread(target=thread_work,args=("守护线程",))
    t.daemon=True
    t.start()
    print("\n主线程")

# 打印内容如下
守护线程
主线程

也许你会说是由于线程太快了,所以才执行了守护线程。下面我们在线程中阻塞一段时间,在来看看会发生什么效果。

from threading import Thread
import time
def thread_work(name):
    time.sleep(3)  # 阻塞3秒
    print(name)

if __name__ == "__main__":
    t = Thread(target=thread_work,args=("守护线程",))
    t.daemon=True
    t.start()
    print("\n主线程")

# 打印内容如下
主线程
守护线程

守护线程还是被执行了,如果是守护进程,守护进程里的代码是不会被执行的。

 


 

线程锁Lock

Lock也称线程同步锁,互斥锁,原子锁,该对象只有两个方法:

acquire(blocking=True, timeout=-1):加锁。

参数:

blocking:当为True时表示加锁,只允许一个线程执行被加锁的代码。直到遇到release()解锁后其它线程才可以执行加锁部分的代码。当为False时表示不加锁,并且不能调用release()否则会报RuntimeError。

timeout:设置加锁时间,单位为秒。-1表示一直等待线程release()后,才允许其它线程执行加锁的代码。

release():释放锁。

未加锁的代码示例

from threading import Thread
import time

def work():
    global n
    temp = n
    time.sleep(0.1)  # 由于线程太快了,所以这里停顿下
    n = temp -1

if __name__ == "__main__":
    n = 100
    t_l = []
    for i in range(100):
        t = Thread(target=work,args=())
        t.start()
        t_l.append(t)
    for i in t_l:
        i.join()
    print(n)

# 打印内容如下
99

在我们看来其实值应该是0的但却是99,就因为短暂停了0.1秒导致结果发生了变化。而我们这0.1秒的停留是模拟网络延迟或者进程调度等原因。造成了数据的结果的错乱。这个时候我们就需要线程锁来保证数据的安全性。

下面我们就通过给程序加锁,来保证数据的安全性:

from threading import Thread,Lock
import time

def work(lock):
    lock.acquire()  # 加锁
    global n
    temp = n
    time.sleep(0.1)  # 由于线程太快了,所以这里停顿下
    n = temp -1
    lock.release()  # 解锁

if __name__ == "__main__":
    n = 100
    t_l = []
    lock = Lock()  # 得到一把锁对象
    for i in range(100):
        t = Thread(target=work,args=(lock,))
        t.start()
        t_l.append(t)
    for i in t_l:
        i.join()
    print(n)

# 打印内容如下
0

我们会发现程序和上一个示例的运行效率上有着很大的差别。明显加锁后程序的运行效率降低了,我们管这种锁叫做线程同步锁,使原本并行的程序编程了串行所以程序的效率会慢很多,但是程序的运行结果是正确的。在程序的运行效率和数据的正确性,我们应首先确保程序的正确性然后在考虑程序的效率。

 


 

递归锁RLock

死锁与递归锁:

所谓死锁: 是指两个或两个以上的进程或线程在执行过程中,出现了一种互相等待的情况,它们都将无法进行下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程,如下模拟产生死锁。

from threading import Lock,Thread

def work():
    # 获取锁
    lock.acquire()
    print("我是工作线程 1")
    # 释放锁
    lock.release()

def work_2():
    # 获取锁
    lock.acquire()
    print("我是工作线程 2")
    work()  # 调用工作线程1,造成死锁
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 生成lock实例
    lock = Lock()
    # 开始3个线程
    for i in range(3):
        t = Thread(target=work_2)
        t.start()
    print('我是主线程')

# 打印内容如下
我是主线程
我是工作线程 2  # 此时程序处于死锁状态

我们可以理解为一把锁对象只能创建一把锁,这把锁必须release后,才能再次使用。否则程序就会被锁住,等待解锁。如上面的代码,work_2执行创建一个lock锁,调用work又遇到一把lock锁,而在work_2中的lock锁没有被解锁,所以程序在work中等待lock解锁,最终造成了程序出现了死锁,下面我们使用递归锁RLock来解决上面的问题。

关于RLock的用法及方法一样,所以这里就不再重复了。

使用RLock避免死锁:

from threading import RLock,Thread

def work():
    # 获取锁
    lock.acquire()
    print("我是工作线程 1")
    # 释放锁
    lock.release()

def work_2():
    # 获取锁
    lock.acquire()
    print("我是工作线程 2")
    work()  # 调用工作线程1,造成死锁
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 使用递归锁RLock
    lock = RLock()
    # 开始3个线程
    for i in range(3):
        t = Thread(target=work_2)
        t.start()
    print('我是主线程')

# 打印内容如下
我是工作线程 2
我是工作线程 1
我是工作线程 2
我是工作线程 1
我是工作线程 2
我是主线程
我是工作线程 1

使用递归锁后程序运行正常了。

 


 

条件对象Condition(lock=None)

Condition条件变量,与锁相关联,在实例化对象时可以给其传入一把锁,如果不传,会默认创建一把递归锁。目前我对它的就理解是它是一把带通知,挂起线程功能的锁。它可以挂起线程,然后发送通知激活线程,并且还可以加锁,属于一把高级锁,下面我们来看看常用的方法。

1、Condition类的方法

class threading.Condition([lock])

acquire():加锁、与Lock、RLock中的用法一致,这里不过多解释。

release():解锁、与Lock、RLock中的用法一致,这里不过多解释

wait(timeout=None):挂起线程,如果timeout是None则必须等到notify或notify_all后线程才会被激活,并且被激活的线程会重新获取到一把锁,线程被激活后从wait挂起的位置继续向下执行。如果指定timeout超时时间,单位为秒,表示线程挂起一段时间后在继续执行。注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。

wait_for(predicate, timeout=None):这个不知道该如何解释。

notify(n=1):激活被挂起的线程,n表示激活n个被挂起的线程,注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。

notify_all():激活所有被挂起的线程,注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。

2、下面是一个无聊的实例:

from threading import Condition,Thread
import time

def consume():
    '''消费者'''
    global cv
    global num
    cv.acquire()
    while True:
        num -= 1
        if num <= 0:
            print('-' * 20)
            cv.notify()  # 激活生产者线程
            cv.wait()
        print(f'消费数据-{num}')
        time.sleep(2)
    cv.release()

def produce():
    '''生产者'''
    global cv
    global num
    cv.acquire()
    while 1:
        num += 1
        print(f'生产数据-{num}')
        if num >= 5:
            print('-' * 20)
            cv.notify()  # 激活消费者线程
            cv.wait()
        time.sleep(0.5)
    cv.release()

if __name__ == '__main__':
    cv = Condition()   # 实例化条件对象
    num = 0
    # 开启线程
    produce_t = Thread(target=produce, args=())
    consume_t = Thread(target=consume, args=())
    produce_t.start()
    consume_t.start()

 


 

Threading类的方法:

threading.active_count():获取当前活动的线程对象数量。

threading.current_thread():获取当前的线程对象。如果调用方的控制线程不是通过线程模块创建的,则返回功能有限的虚拟线程对象。

threading.get_ident():获取线程标识符。

threading.enumerate():这个比较厉害,可以获取当前活动的所有线程对象的列表。该列表包括后台线程和使用current_thread()创建的虚拟线程。以列表的形式返回。

threading.main_thread():获取主线程对象。

 


 

Threading模块就简单介绍到这里吧,参考文档:https://docs.python.org/3/library/threading.html#threading.Condition.notify

 


 

 

下一篇:python协程简介:https://www.cnblogs.com/caesar-id/p/10771369.html

 

posted @ 2019-04-24 20:19  id_iot  阅读(2850)  评论(2编辑  收藏  举报