Python和其他进程的管道通信方式--popen和popen2的比较

目前有一个查询程序 get_user_id 是用C写的，python需要调用这个程序：使用 get_user_id "用户名" 可以得到输出: "ID0002451".

在python中使用管道可以方便的调用这个进程并得到它的标准输出：

get_user_id 是C写的，程序大概的框架如下：得到一个命令行参数，然后根据参数打印其相应的id：

int main(int argc , char* args[])

{

char * name = args[1]

printf("%s",getid(name) );

}

python程序调用的片段如下：

pipe = os.popen( "get_user_id " + "myname")

user_id = pipe.read()

pipe.close()

python是这样调用get_user_id程序的。首先python会启动一个子进程，然后读入子进程的标准输出，最后结束子进程。这里的主要的开销是进程的启动和撤销，管道之间的通信是非常快的。

如果get_user_id调用得不太频繁，则这种调用方式没有问题；若get_user_id调用得很频繁，以致它的性能成为了系统的瓶颈，这就有必要优化了。优化的方法是使得get_user_id子进程常驻内存，python父进程可以使用write/flush和readline的方法和子进程通信；程序结束时撤销子进程。

进程常驻内存后，python只需要启动一次子进程就可以满足任意次的查询。不过带来的麻烦是get_user_id程序需要重写：将它改为在循环中接收标准输入，把结果送往标准输出，另外约定一个特殊的输入（如"EOF"），子进程收到这个输入后退出循环。

get_user_id改后

int main(int argc , char* args[])

{

char name[512]; // buff

while( scanf("%s", name) ){

if (!strcmp(name,"EOF")) return 0;

printf("%s\n",getid(name) );

}

这个C程序先接受标准输入，判断输入是否结束为结束标志，如果是则返回，否则打印用户ID。

Python应该如何调用这个进程呢？使用popen()得到的pipe对象只支持write或者read操作，而不能同时读和写。

需要同时允许读写操作，使用popen2()。该函数返回一个包涵两个元素的tuple,这两个元素依次是写管道（即可向目标进程写入标准输入）和读管道（即读进程的标准输出）。

如果需要和上述C程序打交道，则应该这样打开管道

pipe_out , pipe_in = popen2( " get_user_id " , "wr");

"wr"表示次管道需要先写后读。

具体例子如下：进行10000次查询

import os

if __name__ == "__main__":

pipe_in , pipe_out = popen2("get_user_id", "wr");

for i in range(10000)

pipe_in.write("myname");

pipe_in.write("\n"); #需要换行符

pipe_in.flush(); #需要清空缓冲区

userid = pipe_out.readline(); #读入结果

上述情况需要注意的是，为了和进程顺利交互，一般需要flush，防止io缓冲；尽量写入和读入整行，方便控制管道交互过程。

根据笔者试验显示：使用常驻内存的进程进行10000次调用，比不常驻内存的进程快得多，前者耗费的时间大约是后者的1/5，不过这个结果只是笔者的特例。请读者分析自己的应用场合，看看如何使用python强大的管道工具。

ps，python还有popen3，可打开进程的stdin，stdout和stderr，更好更强大。另外subprocess 模块下有更强大的进程管理接口。

posted @ 2015-04-28 07:27 Jefree 阅读(6343) 评论(0) 收藏举报

刷新页面返回顶部

Python和其他进程的管道通信方式--popen和popen2的比较

公告