31-1 多进程

因为在python中的多线程其实并不是真正的并发,如果想要充分地使用多核CPU,在python中大部分情况需要使用多进程。

Python提供了非常好用的多进程包multiprocessing,借助这个包可轻松实现从单进程到多进程(并发执行)的转换。与threading.Thread类似,它可以利用multiprocessing.Process来创建一个进程。该Process对象与Thread对象的用法也相似,也有start(), run(), join()等方法。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类 (这些对象可以像多线程那样,通过参数传递给各个进程),用以同步进程,其用法与threading包中的同名类一致。

使用时注意以下几点:

  • 在UNIX平台上,当某个进程终结之后,该进程需要被其父进程调用wait,否则进程成为僵尸进程(Zombie)。所以,有必要对每个Process对象调用join()方法 (实际上等同于wait)。对于多线程来说,由于只有一个进程,所以不存在此必要性。
  • multiprocessing提供了threading包中没有的IPC(比如Pipe和Queue),效率上更高。应优先考虑Pipe和Queue,避免使用Lock/Event/Semaphore/Condition等同步方式 (因为它们占据的不是用户进程的资源)。
  • 多进程应该避免共享资源。在多线程中,我们可以比较容易地共享资源,比如使用全局变量或者传递参数。在多进程情况下,由于每个进程有自己独立的内存空间,以上方法并不合适。此时我们可以通过共享内存和Manager的方法来共享资源。但这样做提高了程序的复杂度,并因为同步的需要而降低了程序的效率。
  • window系统下,需要注意的是要想启动一个子进程,必须加上那句if __name__ == "main",进程相关的要写在这句下面,否则会报错。

一、调用

multiprocessing的很大一部份与threading使用同一套API,只不过换到了多进程的情境。其调用方式与threading几乎一样。

1. 直接调用

from multiprocessing import Process
import time


def f(name):
    time.sleep(1)
    print('hello', name,time.ctime())

if __name__ == '__main__':                       # windows下必须加上这句话
    p_list = []
    for i in range(3):
        p = Process(target=f, args=('alvin',))   # 创建进程
        p_list.append(p)
        p.start()                                # 开启进程
    for i in p_list:
        i.join()                                 # 执行完前阻塞
    print('end')

2. 类方法调用

import multiprocessing
import time


class MyProcess(multiprocessing.Process):
    def __init__(self):
        super(MyProcess, self).__init__()     # 等价于multiprocessing.Process.__init__(self)
        #self.name = name                     # 可以传入那么参数给进程重命名

    def run(self):                            # 进程启动后所自动执行的方法
        time.sleep(1)
        print ('hello', self.name, time.ctime())


if __name__ == '__main__':
    p_list = []
    for i in range(3):
        p = MyProcess()
        p.start()
        p_list.append(p)

    for p in p_list:
        p.join()

    print('end')
from multiprocessing import Process
import os
import time


def info(title):
    print(title)
    print('module name:', __name__)
    print('parent process:', os.getppid())   # 获取主进程的 pid
    print('process id:', os.getpid())        # 获取进程的pid


if __name__ == '__main__':
    info('这是主进程')
    time.sleep(5)
    p = Process(target=info, args=('bob',))
    p.start()
    p.join()
    
    
#立即输出结果:
# 这是主进程
# module name: __main__
# parent process: 916   # 相对于当前进程,pycharm是主进程
# process id: 644

#5秒钟后输出:
# bob
# module name: __mp_main__
# parent process: 644   # 相对于当前进程,644为主进程
# process id: 3028
进程号pid

 

二、process类

1. 实例方法

  • is_alive():返回进程是否在运行。
  • join([timeout]):阻塞当前上下文环境的进程程,直到调用此方法的进程终止或到达指定的timeout(可选参数)。
  • start():进程准备就绪,等待CPU调度。
  • run():strat()调用run方法,如果实例进程时未制定传入target,这start执行默认run()方法。
  • terminate():不管任务是否完成,立即停止工作进程。

2. 属性

  • authkey
  • daemon:和线程的setDeamon功能一样。
  • exitcode(进程在运行时为None、如果为–N,表示被信号N结束)
  • name:进程名字。
  • pid:进程号。

 

三、进程间通信和数据共享

不同进程间内存是不共享的,要想实现两个进程间的数据交换,可以用以下方法:

1. 通信

(1)Queue

使用方法跟threading里的queue类似:

from multiprocessing import Process, Queue

def f(q,n):
    q.put([42, n, 'hello'])

if __name__ == '__main__':
    q = Queue()
    p_list=[]
    for i in range(3):
        p = Process(target=f, args=(q,i))  # 将对象q作为参数传入,否则子进程中没有此变量
        p_list.append(p)
        p.start()
    print(q.get())
    print(q.get())
    print(q.get())
    for i in p_list:
            i.join()

(2)Pipe

类似于socket传送数据时的用法。

from multiprocessing import Process, Pipe


def f(conn):
    conn.send([42, None, 'hello'])
    conn.close()


if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=f, args=(child_conn,))
    p.start()
    print(parent_conn.recv())  # prints "[42, None, 'hello']"
    p.join()

2. 数据共享

from multiprocessing import Process, Manager

def f(d, l,n):
    d[n] = '1'
    d['2'] = 2
    d[0.25] = None
    l.append(n)
    print(l)

if __name__ == '__main__':
    with Manager() as manager:
        d = manager.dict()

        l = manager.list(range(5))
        p_list = []
        for i in range(10):
            p = Process(target=f, args=(d, l,i))
            p.start()
            p_list.append(p)
        for res in p_list:
            res.join()

        print(d)
        print(l)

 

 

参考:

http://www.cnblogs.com/yuanchenqi/articles/5745958.html

posted @ 2017-07-28 19:12  seaidler  阅读(103)  评论(0)    收藏  举报