Linux 进程--父进程查询子进程的退出状态


僵尸进程

当一个子进程先于父进程结束运行时,它与其父进程之间的关联还会保持到父进程也正常地结束运行,或者父进程调用了wait才告终止。

子进程退出时,内核将子进程置为僵尸状态,这个进程称为僵尸进程,它只保留最小的一些内核数据结构,以便父进程查询子进程的退出状态。

进程表中代表子进程的数据项是不会立刻释放的,虽然不再活跃了,可子进程还停留在系统里,因为它的退出码还需要保存起来以备父进程中后续的wait调用使用。它将称为一个“僵进程”。

如何避免僵尸进程

  1. 调用wait或者waitpid函数查询子进程退出状态,此方法父进程会被挂起。
  2. 如果不想让父进程挂起,可以在父进程中加入一条语句: signal(SIGCHLD,SIG_IGN);表示父进程忽略SIGCHLD信号,该信号是子进程退出的时候向父进程发送的
  3. 注册信号处理函数,在信号处理函数总调用 wait 函数。

SIGCHLD 信号

当子进程退出的时候,内核会向父进程发送SIGCHLD信号,子进程的退出是个异步事件(子进程可以在父进程运行的任何时刻终止)

如果不想让子进程编程僵尸进程可在父进程中加入:signal(SIGCHLD,SIG_IGN);

如果将此信号的处理方式设为忽略,可让内核把僵尸子进程转交给init进程去处理,省去了大量僵尸进程占用系统资源。(父进程忽略了 SIGCHLD信号之后,会将僵尸子进程转交给init进程给处理,这样子就不保存父子关系了吗?)。

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
int main(void)
{
    pid_t pid;
    if(signal(SIGCHLD,SIG_IGN) == SIG_ERR)
    {
        perror("signal error");
        exit(EXIT_FAILURE);
    }
    pid = fork();
    if(pid == -1)
    {
        perror("fork error");
        exit(EXIT_FAILURE);
    }
    if(pid == 0)
    {
        printf("this is child process\n");
        exit(0);
    }
    if(pid > 0)
    {
        sleep(100);
        printf("this is parent process\n");
    }
    return 0;
}

结果是:
这里写图片描述

可以看到,虽然子进程先退出了,但是进程表中已经不存在子进程的僵尸状态了。(因为被 init 进程处理掉了)

wait() 函数

#include <sys/types.h> 
#include <sys/wait.h>
pid_t wait(int *status);

进程一旦调用了wait,就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程,wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。

参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数情况下,我们都会这样想),我们就可以设定这个参数为NULL,就象下面这样:

                    `pid = wait(NULL)`

如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD

  1. wait系统调用会使父进程暂停执行,直到它的一个子进程结束为止。
  2. 返回的是子进程的PID,它通常是结束的子进程
  3. 状态信息允许父进程判定子进程的退出状态,即从子进程的main函数返回的值或子进程中exit语句的退出码。
  4. 如果status不是一个空指针,状态信息将被写入它指向的位置

可以用一些宏判断子进程的退出情况:
这里写图片描述

示例程序如下:

#include <stdio.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <unistd.h>
int main(void)
{
    pid_t pid;
    pid = fork();
    if(pid < 0){
        perror("fork error");
        exit(EXIT_FAILURE);
    }
    if(pid == 0){
        printf("this is child process\n");
        exit(100);
    }
    int status;
    pid_t ret;
    ret = wait(&status);
    if(ret <0){
        perror("wait error");
        exit(EXIT_FAILURE);
    }
        printf("ret = %d pid = %d\n", ret, pid);
    if (WIFEXITED(status))
        printf("child exited normal exit status=%d\n", WEXITSTATUS(status));
    else if (WIFSIGNALED(status))
        printf("child exited abnormal signal number=%d\n", WTERMSIG(status));
    else if (WIFSTOPPED(status))
        printf("child stoped signal number=%d\n", WSTOPSIG(status));
    return 0;
}

上述程序正常退出exit(100),程序返回值为100。

这里写图片描述

当子进程正常退出的时候, wait返回子进程的 pid, 并且 WIFEXITED(status) 为真, WEXITSTATUS(status)获得返回码。

实例2:

#include <stdio.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <unistd.h>
int main(void)
{
    pid_t pid;
    pid = fork();
    if(pid < 0){
        perror("fork error");
        exit(EXIT_FAILURE);
    }
    if(pid == 0){
        printf("this is child process\n");
        //exit(100);
        abort();
    }
    int status;
    pid_t ret;
    ret = wait(&status);
    if(ret <0){
        perror("wait error");
        exit(EXIT_FAILURE);
    }
        printf("ret = %d pid = %d\n", ret, pid);
    if (WIFEXITED(status))
        printf("child exited normal exit status=%d\n", WEXITSTATUS(status));
    else if (WIFSIGNALED(status))
        printf("child exited abnormal signal number=%d\n", WTERMSIG(status));
    else if (WIFSTOPPED(status))
        printf("child stoped signal number=%d\n", WSTOPSIG(status));
    return 0;
}

上述代码中,程序通过 abort() 系统调用返回,发送 SIGABRT 信号,对此信号的默认动作是终止进程。 并且系统终止的时候,不会 without destroying any objecty and without calling any of the function passed to atexit or at_quick_exit

结果如下:
这里写图片描述

当程序异常退出的时候, WIFSIGNALED(status) 为真,可用 WTERMSIG(status) 返回相应的信号代码。

(另外,WIFSTOPPED,子进程被暂停也会被父进程捕捉到,但是并不代表子进程已经是处于退出状态吧?? 不太确定)

waitpid() 函数

waitpid() 是一个非常有用的函数,不单单可以等待子进程。 还可以等待进程组中的任意一个进程。 可以看到 wait() 函数实际上是 waitpid() 函数的特例。

#include <sys/types.h> 
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *status, int options);
参数:
status:如果不是空,会把状态信息写到它指向的位置,与wait一样
options:允许改变waitpid的行为,最有用的一个选项是WNOHANG,它的作用是防止waitpid把调用者的执行挂起 (也就是不阻塞父进程)

对于waitpid的p i d参数的解释与其值有关:
pid == -1 等待任一子进程。于是在这一功能方面waitpid与wait等效。

pid > 0 等待其进程I D与p i d相等的子进程。

pid == 0 等待其组I D等于调用进程的组I D的任一子进程。换句话说是与调用者进程同在一个组的进程。

pid < -1 等待其组I D等于p i d的绝对值的任一子进程

wait与waitpid区别:

在一个子进程终止前, wait 使其调用者阻塞,而waitpid 有一选择项,可使调用者不阻塞。
waitpid并不等待第一个终止的子进程—它有若干个选择项,可以控制它所等待的特定进程。
实际上wait函数是waitpid函数的一个特例。waitpid(-1, &status, 0);

代码如下:

#include <stdio.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <unistd.h>
int main(void)
{
    pid_t pid;
    pid = fork();
    if(pid < 0){
        perror("fork error");
        exit(EXIT_FAILURE);
    }
    if(pid == 0){
        printf("this is child process\n");
        sleep(5);
        exit(100);
    }
    int status;
    pid_t ret;
    ret = waitpid(pid,&status,WNOHANG);
    if(ret <0){
        perror("wait error");
        exit(EXIT_FAILURE);
    }
        printf("ret = %d pid = %d\n", ret, pid);
    if (WIFEXITED(status))
        printf("child exited normal exit status=%d\n", WEXITSTATUS(status));
    else if (WIFSIGNALED(status))
        printf("child exited abnormal signal number=%d\n", WTERMSIG(status));
    else if (WIFSTOPPED(status))
        printf("child stoped signal number=%d\n", WSTOPSIG(status));
    return 0;
}

结果如下:
这里写图片描述

这里可以看到,首先 option 设置为了 WNOHANG 之后,父进程不会等待子进程的退出,也就是不会阻塞,如果没有子进程的退出立即返回-1。

上述中的代码是有问题的: 首先 ret = 0, 是什么意思? 如果没有子进程的退出了,那么上述代码中检测 WIFEXITED(status) 就失去了意义,所以还需要增加一个判断条件,判断是否有子进程退出。也就是ret > 0的选项。

关于父子进程之间还有很多话题可以讲述,以后慢慢的一一道来。

posted @ 2018-03-20 18:36  梁天  阅读(14258)  评论(0编辑  收藏  举报