fork exec

　 Linux下一个进程在内存里有三部分的数据，就是"代码段"、"堆栈段"和"数据段"。其实学过汇编语言的人一定知道，一般的CPU都有上述三种段寄存器，以方便操作系统的运行。这三个部分也是构成一个完整的执行序列的必要的部分。
   在传统的Unix环境下，有两个基本的操作用于创建和修改进程：函数fork( )用来创建一个新的进程，该进程几乎是当前进程的一个完全拷贝；函数族exec()用来启动另外的进程以取代当前运行的进程。Linux的进程控制和传统的Unix进程控制基本一致，只在一些细节的地方有些区别，例如在Linux系统中调用vfork和fork完全相同，而在有些版本的Unix系统中，vfork调用可能有不同的功能。
     fork函数启动一个新的进程，这个进程几乎是当前进程的一个拷贝：子进程和父进程使用相同的代码段；子进程复制父进程的堆栈段和数据段。这样，父进程的所有数据都可以留给子进程，但是，子进程一旦开始运行，虽然它继承了父进程的一切数据，但实际上数据却已经分开，相互之间不再有影响了，也就是说，它们之间不再共享任何数据了。它们再要交互信息时，只有通过进程间通信来实现，这将是我们下面的内容。既然它们如此相象，系统如何来区分它们呢？这是由函数的返回值来决定的。对于父进程， fork函数返回了子程序的进程号，而对于子程序，fork函数则返回零。在操作系统中，我们用ps函数就可以看到不同的进程号，对父进程而言，它的进程号是由比它更低层的系统调用赋予的，而对于子进程而言，它的进程号即是fork函数对父进程的返回值。在程序设计中，父进程和子进程都要调用函数fork（）下面的代码，而我们就是利用fork（）函数对父子进程的不同返回值用if...else...语句来实现让父子进程完成不同的功能，正如我们上面举的例子一样。我们看到，上面例子执行时两条信息是交互无规则的打印出来的，这是父子进程独立执行的结果，虽然我们的代码似乎和串行的代码没有什么区别。
　　如果一个大程序在运行中，它的数据段和堆栈都很大，一次fork就要复制一次，那么fork的系统开销不是很大吗？其实UNIX自有其解决的办法，大家知道，一般CPU都是以"页"为单位来分配内存空间的，每一个页都是实际物理内存的一个映像，象INTEL的CPU，其一页在通常情况下是 4086字节大小，而无论是数据段还是堆栈段都是由许多"页"构成的，fork函数复制这两个段，只是"逻辑"上的，并非"物理"上的，也就是说，实际执行fork时，物理空间上两个进程的数据段和堆栈段都还是共享着的，当有一个进程写了某个数据时，这时两个进程之间的数据才有了区别，系统就将有区别的" 页"从物理上也分开。系统在空间上的开销就可以达到最小。

exec()函数族
     一个进程如何来启动另一个程序的执行。在Linux中要使用exec函数族。系统调用execve（）对当前进程进行替换，替换者为一个指定的程序，其参数包括文件名（filename）、参数列表（argv）以及环境变量（envp）。exec函数族当然不止一个，但它们大致相同，在 Linux中，它们分别是：execl，execlp，execle，execv，execve和execvp，下面我只以execlp为例，其它函数究竟与execlp有何区别，请通过manexec命令来了解它们的具体情况。
　　一个进程一旦调用exec类函数，它本身就"死亡"了，系统把代码段替换成新的程序的代码，废弃原有的数据段和堆栈段，并为新程序分配新的数据段与堆栈段，唯一留下的，就是进程号，也就是说，对系统而言，还是同一个进程，不过已经是另一个程序了。（不过exec类函数中有的还允许继承环境变量之类的信息。）
    那么如果我的程序想启动另一程序的执行但自己仍想继续运行的话，怎么办呢？那就是结合fork与exec的使用。

//fork的用法
#include<unistd.h>
#include<stdio.h>
void main() {
    printf("main thread:%d\n", getpid());

    int pid = fork();
    if (pid < 0) {
        printf("fork error\n");
    } else if (pid == 0) {
        printf("pid == 0 current pid:%d\n", getpid());
    } else if (pid > 0) {
        printf("pid > 0 pid:%d\n", getpid());
    }

    printf("where? pid:%d\n", getpid());
}

     vfork用于创建一个新进程，而该新进程的目的是exec一个新进程，vfork和fork一样都创建一个子进程，但是它并不将父进程的地址空间
完全复制到子进程中，因为子进程会立即调用exec，于是也就不会存放该地址空间。不过在子进程中调用exec或exit之前，他在父进程的空间中运行。

     vfork和fork之间的另一个区别是： vfork保证子进程先运行，在她调用exec或exit之后父进程才可能被调度运行。如果在调用这
两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。

      用fork函数创建子进程后，子进程往往要调用一种exec函数以执行另一个程序，当进程调用一种exec函数时，该进程完全由新程序代换，
而新程序则从其main函数开始执行，因为调用exec并不创建新进程，所以前后的进程id 并未改变，exec只是用另一个新程序替换了当
前进程的正文，数据，堆和栈段。

// print.c  => print.o
#include<stdio.h>
void main(int argc, char **argv) {
    printf("print 111111111\n");
}

//fe.c
#include<stdio.h>
#include<pthread.h>
void main(int argc, char **argv) {
    //pit_t int
    pid_t pid = fork();

    if (pid == 0) {
        printf("Child thread pid:%d\n", getpid());
        execvp ("/home/daichenghui/c/print.o", NULL);   //使用全路径，否则可能会找不到路径
    } else if (pid > 0) {
        printf("Parent thread pid:%d\n", getpid());
        printf("Parent thread id:%lu\n", pthread_self());
    } else {
        printf("fork error.\n");
    }

    printf("Thread pid:%d\n", getpid());
}

daichenghui@daichenghui-OptiPlex-3020:~/c$ gcc -o print.o print.c
daichenghui@daichenghui-OptiPlex-3020:~/c$ gcc -o fe.o fe.c

daichenghui@daichenghui-OptiPlex-3020:~/c$ ./fe.o
Parent thread pid:2922
Parent thread id:0
Thread pid:2922
Child thread pid:2923
daichenghui@daichenghui-OptiPlex-3020:~/c$ print 111111111

daichenghui@daichenghui-OptiPlex-3020:~/c$

exec与system的区别

(1) exec是直接用新的进程去代替原来的程序运行，运行完毕之后不回到原先的程序中去。

(2) system是调用shell执行你的命令，system=fork+exec+waitpid,执行完毕之后，回到原先的程序中去。继续执行下面的部分。

总之，如果你用exec调用，首先应该fork一个新的进程，然后exec. 而system不需要你fork新进程，已经封装好了

posted @ 2015-04-13 17:25 牧天阅读(218) 评论(0) 收藏举报

刷新页面返回顶部

牧 天

fork exec

公告

牧天