python 进程(程序操作)
multiprocessing模块
仔细说来,multiprocessing不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便大家归类记忆,我将这部分大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享。
multiprocessing.process模块
process模块介绍
process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。
Process([group [, target [, name [, args [, kwargs]]]]]),由该类实例化得到的对象,表示一个子进程中的任务(尚未启动) 强调: 1. 需要使用关键字的方式来指定参数 2. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号 参数介绍: group参数未使用,值始终为None target表示调用对象,即子进程要执行的任务 args表示调用对象的位置参数元组,args=(1,2,'egon',) kwargs表示调用对象的字典,kwargs={'name':'egon','age':18} name为子进程的名称
p.start():启动进程,并调用该子进程中的p.run()
p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法
p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放,进而导致死锁
p.is_alive():如果p仍然运行,返回True
p.join([timeout]):主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程
p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置
p.name:进程的名称
p.pid:进程的pid
p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底层进程间通信提供安全性,这类连接只有在具有相同的身份验证键时才能成功(了解即可)
在Windows操作系统中由于没有fork(linux操作系统中创建进程的机制),在创建子进程的时候会自动 import 启动它的这个文件,而在 import 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if __name__ ==‘__main__’ 判断保护起来,import 的时候 ,就不会递归运行了。
创建进程
from multiprocessing import Process import time def func(): time.sleep(1) print("这是子进程") if __name__ =='__main__' : p = Process(target=func) p.start() time.sleep(2) print('这是主进程')
from multiprocessing import Process import time def func(name): print('子进程名字%s'%name) time.sleep(5) print('这是子进程') if __name__ == '__main__' : p = Process(target=func,args=('Peter',)) p.start() time.sleep(2) p.join() # 代码执行到这里,主进程main会停止等待子进程执行完毕才继续 print('这是主进程')
from multiprocessing import Process import os def func(): print('我是子进程,我的进程id是%s,我爸爸的id是%s'%(os.getpid(),os.getppid())) if __name__ == '__main__': print('我是main爸爸,我的进程id是%s' % os.getpid()) for i in range(5): p = Process(target = func,args=()) p.start()
from multiprocessing import Process import time def func(i): print('这里是第%s个子进程'%(i)) time.sleep(1) if __name__ == '__main__': print('这里是main爸爸') for i in range(5): p = Process(target = func,args=(i,)) p.start()
from multiprocessing import Process import time def func(i): print('这里是第%s个子进程'%(i)) time.sleep(1) if __name__ == '__main__': for i in range(5): p = Process(target = func,args=(i,)) p.start() p.join()# main会停在这一句,等子进程执行完,再继续走,也就是才再走下一次for循环 print('这里是main爸爸')
from multiprocessing import Process import time def func(i): print('第%s个子进程'%i) time.sleep(1) if __name__ =='__main__' : l = [] for i in range(5): p = Process(target = func,args=(i,)) p.start() l.append(p) [i.join() for i in l ] print('这是主进程')
用继承方法开启多进程(继承process类)
from multiprocessing import Process import os class MyProcess(Process): def __init__(self,name): super().__init__() self.name =name def run(self): print('我是%s,我的id是%s'%(self.name,os.getpid()) if __name__ == "__main__" : p1 = MyProcess('老李') p2 = MyProcess('老张') p3 = MyProcess('老王') p1.start()# 调用start方法,start方法内自动调用run方法 p2.start() # p2.run() p3.start() p1.join() p2.join()# 注意,如果调用run方法,就不能再调用join方法 p3.join() print('我是main爸爸')
from multiprocessing import Process def func(): global n n = 0 print('子进程内 n = %s'%n) if __name__ == '__main__': n = 100 p = Process(target=func) p.start() print('主进程内 n = %s'%n)
守护进程 daemon
会随着父进程的结束而结束。
父进程创建守护进程
其一:守护进程会在父进程代码执行结束后就终止
其二:守护进程内无法再开启子进程,否则抛出异常:AssertionError: daemonic processes are not allowed to have children
注意:进程之间是互相独立的,父进程代码运行结束,守护进程随即终止(是代码运行结束,而不是解释器读完代码,是要执行完,守护进程才终止)
from multiprocessing import import time def func(): print('子进程开始执行') time.sleep(2) print('子进程结束执行') if __name__ == '__main__': print('主进程开始执行') p = Process(target=func1,) p.daemon = True #将p 设置为守护进程,此代码一定要在start之前设置。 p.start() time.sleep(1) print('主进程结束执行')
from multiprocessing import Process import time def func2(): print('子进程2开始执行') time.sleep(2) print('子进程2结束执行') def func1(): print('子进程开始执行') time.sleep(2) print('子进程结束执行') if __name__ == '__main__': print('主进程开始执行') p1 = Process(target=func1,) p2 = Process(target=func2) p1.daemon = True# 将p1 设置为守护进程,此代码一定要在start之前设置。 p1.start() p2.start() time.sleep(1)# 此时p1 p2 和main 都已经开始执行 print('主进程结束执行')# 当主进程打印完这句话,代表主进程结束,守护进程p1肯定随之结束 # 但是p2 不是守护进程,不会结束,所以此时程序(也就是主进程)会等待p2结束之后才结束。
from multiprocessing import Process import random import time class MyProcess(Process): def __init__(self,name): super(MyProcess, self).__init__() self.name = name# name是父类Process中的属性,这里相当于给子进程命名 def run(self): print('%s 正在撩小姐姐'%self.name) time.sleep(random.randint(1,3)) print('%s 还在撩小姐姐'%self.name) if __name__ == '__main__': p = MyProcess('Alex') p.start() time.sleep(0.1) p.terminate()# 将p进程杀死的命令。 将任务提交给操作系统,操作系统什么时候执行不受用户决定 print(p.is_alive())# 判断p进程是否还存在 time.sleep(1) print(p.is_alive())# 判断p进程是否还存在
from multiprocessing import Process import random import time class MyProcess(Process): def __init__(self,name): super(MyProcess, self).__init__() self.name = name# name是父类Process中的属性,这里相当于给子进程命名 def run(self): print('%s 正在撩小姐姐'%self.name) time.sleep(random.randint(1,3)) print('%s 还在撩小姐姐'%self.name) if __name__ == '__main__': p = MyProcess('Alex') p.start() print(p.name,p.pid)# 打印进程名字,进程id号