Linux 管道

管道(pipe)是进程间通信的一种实现方式。在 Linux 系统中,管道本质上是一种特殊的文件,它的主要用途是实现进程间的通信。文中演示所用环境为 Ubuntu 18.04 desktop。

在 shell 中执行下面的命令:

$ echo abc | cat

echo 命令的输出通过管道作为了 cat 命令的输入。这里面的具体操作是由 shell 程序完成的。

管道的一个显著特点是:创建一个管道后,会获得两个文件描述符,分别用于对管道进行读取和写入操作。通常将这两个文件描述符称为管道的读取端和写入端,从写入端写入管道的任何数据都可以从读取端读取。
对一个进程来说,管道的写入和读取操作与写入和读取一个普通文件没有什么区别,只是在内核中通过这种机制来实现进程间的通信而已。

管道的创建和关闭

创建管道使用的系统调用的函数声明如下:

#include <unistd.h>
int pipe(int filedescriptors[2]);

pipe 函数相对来说是一个比较底层的函数,它创建一个管道(相对于命名管道而言,这个管道又被称为匿名管道)。参数 filedescriptors 是一个长度为 2 的整型数组,用于存放调用该函数所创建管道的文件描述符。其中 filedescriptors[0] 存放管道读取端的文件描述符,filedescriptors[1] 存放管道写入端的文件描述符。调用成功时,返回值为 0;调用失败时,返回值为 -1。
由此可知,管道本身是一个抽象的概念,其本质是通过对特殊文件的读写实现进程间的通信。一个管道实际上就是个只存在于内存中的文件,对这个文件的操作要通过两个文件描述符进行,它们分别代表管道的两端。因此管道是一种特殊的文件,它不属于某一种文件系统,而是一种独立的文件系统,有其自己的数据结构。

调用 pipe 函数创建了一个管道后,还不能实现通过管道在两个进程间通信的目的,因为此时管道的读取端和写入端的文件描述符都属于同一个进程。我们知道,在 Linux 系统中,通过 fork 系统调用创建子进程时,父进程中打开的文件描述符仍将保持打开状态。所以,常见的做法是:先在父进程中创建管道,然后通过 fork 调用创建子进程,这时就可以通过管道在父子进程间传递数据了。
实际的使用中,常常在子进程中调用 exec 族函数执行特定的程序,然后根据数据传输的方向分别关闭父进程和子进程中的一个文件描述符(注意,此时只能单向传输数据。如果要双向传输数据,最好是创建两个单向传输的管道)。例如:要实现父进程向子进程传输数据,则关闭父进程中的读取端(filedescriptors[0])文件描述符和子进程中的写入端文件描述符(filedescriptors[1])。

下面的 demo 演示了如何在父子进程和子进程之间建立管道:

#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>

int main(void)
{
    int file_pipes[2];
    pid_t fork_result;

    if(pipe(file_pipes) == 0)
    {
        fork_result = fork();
        if(fork_result == -1)
        {
            fprintf(stderr, "Fork failure");
            exit(EXIT_FAILURE);     
        }
        if(fork_result == 0)
        {
            close(file_pipes[1]);
            exit(EXIT_SUCCESS);
        }
        else
        {
            close(file_pipes[0]);
        }
    }
    exit(EXIT_SUCCESS);
}

上面的代码创建了一个由父进程向子进程传输数据的管道。

管道的读写操作

由于管道是一种特殊的文件,用户在使用中完全可以像读写普通文件一样对管道进行读写,所使用的函数为 read 和 write。
系统定义的常数 PIPE_BUF 规定了管道缓冲区的大小,当写入数据超过规定的大小时,就会发生数据错乱。
虽然管道是一种特殊的文件,它的读写操作和普通文件的读写操作也完全相同,但管道不是一个真实存在的文件,它只在内核中存储,而不存在于文件系统中。

下面是扩展后的 demo,演示了如何在父子进程和子进程之间建立管道并传输数据:

#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>

int main(void)
{
    int data_processed;
    int file_pipes[2];
    const char some_data[] = "123";
    char buffer[BUFSIZ + 1];
    pid_t fork_result;

    memset(buffer, '\0', sizeof(buffer));

    if(pipe(file_pipes) == 0)
    {
        fork_result = fork();
        if(fork_result == -1)
        {
            fprintf(stderr, "Fork failure");
            exit(EXIT_FAILURE);     
        }
        if(fork_result == 0)
        {
            close(file_pipes[1]);
            data_processed = read(file_pipes[0], buffer, BUFSIZ);
            printf("Read %d bytes: %s\n", data_processed, buffer);
            exit(EXIT_SUCCESS);
        }
        else
        {
            close(file_pipes[0]);
            data_processed = write(file_pipes[1], some_data, strlen(some_data));
            printf("Write %d bytes\n", data_processed);
        }
    }
    exit(EXIT_SUCCESS);
}

把上面的代码保存到文件 pipedemo.c 中,并编译:

$ gcc -Wall pipedemo.c -o pipe_demo

然后运行程序:

$ ./pipe_demo

这个程序先调用 pipe 函数创建一个管道,接着调用 fork 函数创建出一个子进程。如果 fork 函数调用成功,父进程就向管道中写入数据,而子进程则从管道中读取数据。父子进程都在只调用了一次 write 或 read 之后退出。

管道(匿名管道)的缺点

管道虽然被广泛使用,但是也有其局限性。管道的最大特点就是要求进程之间具有同源性,即它们必须是最终由同一个进程所派生的进程。当然这个缺点可以通过命名管道解决。
管道的另一个缺点是半双工的工作方式,即只允许单向传输数据。这一点管道和命名管道是相同的,可以创建两个单向管道来实现数据的双向传输。

参考:
《Linux 程序设计》
《Linux 环境下 C 编程指南》

posted @ 2019-06-11 13:08  sparkdev  阅读(3015)  评论(0编辑  收藏  举报