[Linux] 进程

PCB概念

每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体, 其中包含以下信息。

  • 进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非
    负整数。
  • 进程的状态,有运行、挂起、停止、僵尸等状态。
  • 进程切换时需要保存和恢复的一些CPU寄存器。
  • 描述虚拟地址空间的信息。
  • 描述控制终端的信息。
  • 当前工作目录(Current Working Directory)。
  • umask掩码。
  • 文件描述符表,包含很多指向file结构体的指针。
  • 和信号相关的信息。
  • 用户id和组id。
  • 控制终端、Session和进程组。
  • 进程可以使用的资源上限(Resource Limit)。

fork和exec是本章要介绍的两个重要的系统调用。fork的作用是根据一个现有的进程复
制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(Child
Process)。

进程原语: fork

#include <unistd.h>
pid_t fork(void);

子进程复制父进程的0到3g空间和父进程内核中的PCB,但id号不同。
fork调用一次返回两次.

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>

int main()
{
    pid_t pid;
    char *message;
    int n;

    pid = fork();
    if(pid < 0){
        perror("fork error!");
        exit(1);
    }else if(pid == 0){
        message = "This is the child\n";
        n = 6;
    }else{
        message = "This is the parent\n";
        n = 3;
    }

    for(; n > 0; n--){
        printf(message);
        sleep(1);
    }

    return 0;
}

进程相关函数

#include <sys/types.h>
#include <unistd.h>

pid_t getpid(void);  //返回调用进程的PID号
pid_t getppid(void); //返回调用进程父进程的PID号
uid_t getuid(void);  //返回实际用户ID
uid_t geteuid(void); //返回有效用户ID
gid_t getgid(void);  //返回实际用户组ID
gid_t getegid(void); //返回有效用户组ID

进程原语: exec族

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),
子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的
用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建
新进程,所以调用exec前后该进程的id并未改变。
其实有六种以exec开头的函数,统称exec函数:

#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错
则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。

// 子进程创建成功后调用exex函数执行firefox程序
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
	pid_t pid;

	pid = fork();

	if(pid == 0){
		execl("/usr/bin/firefox", "firefox", "www.baidu.com", NULL);
	}
	else if(pid > 0){
		while(1){
			printf("parent\n");
			sleep(1);
		}
	}
	else{
		perror("fork");
		exit(1);
	}
	return 0;
}

进程原语: wait/waitpid

僵尸进程: 子进程退出,父进程没有回收子进程资源(PCB),则子进程变成僵尸进程
孤儿进程: 父进程先于子进程结束,则子进程成为孤儿进程,子进程的父进程变成1号
进程init进程,称为init进程领养孤儿进程

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
pid_t waitpid(pid_t pid, int *status, int options);

返回值:
< -1 回收指定进程组内的任意子进程
-1 回收任意子进程
0 回收和当前调用waitpid一个组的所有子进程
> 0 回收指定ID的子进程

一个进程在终止时会关闭所有文件描述符,释放在用户空间分配的内存,但它的PCB还
保留着,内核在其中保存了一些信息:如果是正常终止则保存着退出状态,如果是异常终止
则保存着导致该进程终止的信号是哪个。这个进程的父进程可以调用wait或waitpid获取这
些信息,然后彻底清除掉这个进程。

如果一个进程已经终止,但是它的父进程尚未调用wait或waitpid对它进行清理,这时
的进程状态称为僵尸(Zombie)进程。
任何进程在刚终止时都是僵尸进程,正常情况下,僵
尸进程都立刻被父进程清理了,为了观察到僵尸进程,我们自己写一个不正常的程序,父进
程fork出子进程,子进程终止,而父进程既不终止也不调用wait清理子进程, 程序运行时在另一个终端输入ps aux可以看到处于僵尸状态的子进程.

#include <unistd.h>
#include <stdlib.h>

int main(void)
{
    pid_t pid = fork();

    if(pid < 0) {
        perror("fork");
        exit(1);
    }
    if(pid > 0) {/* parent */
        while(1);
    }
    /* child */
    
    return 0;
}

若调用成功则返回清理掉的子进程id,若调用出错则返回-1。父进程调用wait或waitpid时可能会:

  • 阻塞(如果它的所有子进程都还在运行)。
  • 带子进程的终止信息立即返回(如果一个子进程已终止,正等待父进程读取其终止信
    息)。
  • 出错立即返回(如果它没有任何子进程)。

这两个函数的区别是:

  • 如果父进程的所有子进程都还在运行,调用wait将使父进程阻塞,而调用waitpid时如
    果在options参数中指定WNOHANG可以使父进程不阻塞而立即返回0。
  • wait等待第一个终止的子进程,而waitpid可以通过pid参数指定等待哪一个子进程。

可见,调用wait和waitpid不仅可以获得子进程的终止信息,还可以使父进程阻塞等待子进
程终止,起到进程间同步的作用。如果参数status不是空指针,则子进程的终止信息通过
这个参数传出,如果只是为了同步而不关心子进程的终止信息,可以将status参数指定为
NULL。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>

int main()
{
	pid_t pid;
	pid = fork();

	if(pid > 0){ // 当前处于父进程
		while(1){
			printf("I'm parent, parent id = %d\n", getpid());
			// 通过父进程回收子进程的PCB, wait返回值是子进程的ID号
			// 直到回收完子进程才会继续执行父进程, wait是一个阻塞函数
			printf("wait for child pid = %d\n", wait(NULL));
			sleep(1);
		}
	}else if(pid == 0){ // 子进程结束后变成僵尸进程
		printf("I'm child, child id = %d\n", getpid());
		sleep(3);
		// 用户空间已经释放掉了, 但是PCB没有释放, PCB要等待父进程回收
	}else{
		perror("fock");
		exit(1);
	}
	return 0;
}

/* 运行结果
$ ./a.out 
I'm parent, parent id = 13351
I'm child, child id = 13352
[由于父进程的wait阻塞机制, 中间会等待3秒, 直到回收完子进程才会继续执行父进程]
wait for child pid = 13352
I'm parent, parent id = 13351
wait for child pid = -1 [已经回收完子进程了, 返回-1]
I'm parent, parent id = 13351
wait for child pid = -1
*/
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
    pid_t pid;
    pid = fork();
    if (pid < 0) {
        perror("fork failed");
        exit(1);
    }
    if (pid == 0) {
        int i;
        for (i = 3; i > 0; i--) {
            printf("This is the child\n");
            sleep(1);
        }
        exit(3);
    } else {
        int stat_val;
        waitpid(pid, &stat_val, 0);
        if (WIFEXITED(stat_val))
        printf("Child exited with code %d\n", WEXITSTATUS(stat_val));
        else if (WIFSIGNALED(stat_val))
        printf("Child terminated abnormally, signal %d\n", WTERMSIG(stat_val));
    }
    return 0;
}

/*
This is the child
This is the child
This is the child
Child exited with code 3
*/
posted @ 2017-08-15 23:37  moon1992  阅读(325)  评论(0)    收藏  举报