UNIX环境编程学习笔记(20)——进程管理之exec 函数族

lienhua34
2014-10-07

在文档“进程控制三部曲”中,我们提到 fork 函数创建子进程之后,通常都会调用 exec 函数来执行一个新程序。调用 exec 函数之后,该进程就将执行的程序替换为新的程序,而新的程序则从 main 函数开始执行。

UNIX 提供了 6 种不同的 exec 函数供我们使用。它们的原型如下所示,

#include <unistd.h>
int execl(const char *pathname, const char *arg0, ... /* (char *)0 */);
int execv(const char *pathname, char *const argv[]);
int execle(const char *pathname, const char *arg0, ... /* (char *)0, char *const envp[] */);
int execve(const char *pathname, char *const argv[], char *const envp[]);
int execlp(const char *filename, const char *arg0, ... /* (char *)0 */);
int execvp(cosnt char *filename, char *const argv[]);
6个函数的返回值:若出错则返回-1,若成功则没有返回值

可能很多人会觉得这六个函数太难记了。但是,我们仔细观察会发现,这六个函数的命名是有一些规律的。

• 含有 l 和 v 的 exec 函数的参数表传递方式是不同的。

• 含有 e 结尾的 exec 函数会传递一个环境变量列表。

• 含有 p 结尾的 exec 函数取的是新程序的文件名作为参数,而其他exec 函数取的是新程序的路径。

1 exec 函数的参数表传递方式

exec 函数给新程序传递参数表方式的不同可以通过 exec 函数名称来体现。含有 l(l 表示 list)的 exec 函数(execl、execle 和 execlp)将新程序的参数表以列表的方式传递,要求每个命令行参数作为一个单独的参数,最后空指针结尾。含有 v(v 表示 vector)的 exec 函数(execv、execve 和execvp)将新程序的参数表构造成一个数组进行传递。下面我们来看一个例子,我们有一个程序 echoargs.c,其输出所有的命令行参数。

#include <stdio.h>
#include <stdlib.h>

int
main(int argc, char *argv[])
{
  int i;
  for (i = 1; i < argc; i++) {
    printf("arg%d: %s\n", i, argv[i]);
  }
  exit(0);
}

编译该程序,生成 echoargs 文件,

lienhua34:demo$ gcc -o echoargs echoargs.c

然后在我们的 execdemo.c 中分别以两种不同参数表传递方式来调用execl 和 execv 函数,

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>

char echoargsPath[] = "/home/lienhua34/program/c/apue/ch08/demo/echoargs";
char *myargs[] = {"echoargs", "This", "is", "a", "demo" };

int
main(void)
{
  pid_t pid;

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Transmits arguments by vector\n");
    if (execv(echoargsPath, myargs) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Transmits arguments by list\n");
    if (execl(echoargsPath, myargs[0], myargs[1],
              myargs[2], myargs[3], "another", myargs[4], (char *)0) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);
  
  exit(0);
}
View Code

编译该程序,生成并执行文件 execdemo,

lienhua34:demo$ gcc -o execdemo execdemo.c
lienhua34:demo$ ./execdemo
Transmits arguments by vector
arg1: This
arg2: is
arg3: a
arg4: demo
Transmits arguments by list
arg1: This
arg2: is
arg3: a
arg4: another
arg5: demo

观察上面的程序 execdemo.c,我们看到传递的参数表中 myargs[0] 等于“echoargs”。这是因为在 C 语言中 main 函数的命令行参数第一个默认都是要该执行程序的文件名。所以,我们这里调用 exec 函数传递参数表是第一个参数也要设置为要执行的新程序文件名。

需要特别说明一点,在调用 execl、execle 和 execlp 函数传递参数表,在最后一个命令行参数之后跟着一个空指针。如果要用常量 0 来表示空指针,则必须要将它转换为一个字符指针,否则它默认会是整型参数。如果一个整型数的长度和 char * 的长度不同,那么 exec 函数在执行时的实际参数将会出错。

2 带有环境变量列表的 exec 函数

带有 e 结尾的 exec 函数(execle 和 execve)可以传递一个指向环境字符串指针数组的指针。其他四个 exec 函数则使用调用进程中的 environ 变量(关于 environ 变量可以参考文档“进程环境变量”)为新进程复制现有的环境。

下面我们来看一个例子。我们有一个 echoenv.c 文件,其输出进程的所有环境变量,其代码如下所示,

#include <stdlib.h>
#include <stdio.h>

int
main(void)
{
  extern char **environ;
  char **ptr;

  for (ptr = environ; *ptr != NULL; ptr++) {
    printf("%s\n", *ptr);
  }
  exit(0);
}

编译该文件,生成并执行 echoenv 文件,

lienhua34:demo$ gcc -o echoenv echoenv.c
lienhua34:demo$ ./echoenv
MANPATH=/usr/local/texlive/2013/texmf-dist/doc/man:
/usr/local/texlive/2013/texmf-dist/doc/man:
SSH_AGENT_PID=1693
...
XAUTHORITY=/home/lienhua34/.Xauthority
_=./echoenv

下面 execedemo.c 文件中,我们分别使用 execv 函数和 execve 函数调用 echoenv 文件,然后查看两者打印的环境变量列表有什么区别。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>

char echoenvPath[] = "/home/lienhua34/program/c/apue/ch08/demo/echoenv";
char *myEnvs[] = { "env1=foo", "env2=bar" };

int
main(void)
{
  pid_t pid;

  if (putenv("newenv=add in parent process") < 0) {
    printf("putenv error: %s\n", strerror(errno));
    exit(-1);
  }
  
  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Call echoenv by execv\n");
    if (execv(echoenvPath, NULL) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("\nCall echoenv by execve\n");
    if (execve(echoenvPath, NULL, myEnvs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);
  
  exit(0);
}
execedemo.c

编译该程序,生成并执行文件 execedemo,

lienhua34:demo$ gcc -o execedemo execedemo.c
lienhua34:demo$ ./execedemo
Call echoenv by execv
MANPATH=/usr/local/texlive/2013/texmf-dist/doc/man:
/usr/local/texlive/2013/texmf-dist/doc/man:
SSH_AGENT_PID=1693
...
XAUTHORITY=/home/lienhua34/.Xauthority
_=./execedemo
newenv=add in parent process
Call echoenv by execve
env1=foo
env2=bar

从上面的运行结果,我们看到调用 execv 函数时父进程会将其设置的环境变量(newenv=add in parent process)也传递给了子进程。而调用execve 函数时,子进程的环境变量列表只有 execve 函数传递的 myEnvs 列表。

3 取文件名作为参数的 exec 函数

含有 p 作为结尾的两个 exec 函数(execlp 和 execvp)传递的是新程序的文件名,而其它四个传递的是路径名。这两个 exec 函数传递的 filename参数按照 PATH 环境变量,在指定的各个目录中寻找可执行文件。

PATH 环境变量包含一张目录表(称为路径前缀),目录之间用冒号(:)分割。例如,
    PATH=/bin:/usr/bin:/usr/local/bin:.
指定了四个目录项,最后一个路径前缀是当前目录。(零长前缀也表示当前目录,在 value 的开始处可用: 表示,在行中间则要用:: 表示,在行尾则以:表示。)

我们来看一个例子。我们有一个 execvpdemo.c 文件,在该文件的目录下有一个 echoargs 可执行文件,该执行文件输出命令行参数。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>
char *myargs[] = {"echoargs", "hello" };
int
main(void)
{
  pid_t pid;
  char *pathEnvVal;
  
  if ((pathEnvVal = getenv("PATH")) == NULL) {
    printf("putenv error: %s\n", strerror(errno));
    exit(-1);
  }
  printf("PATH=%s\n", pathEnvVal);
  
  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    if (execvp("echoargs", myargs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if (setenv("PATH", "/usr/bin:.", 1) < 0) {
    printf("setenv error: %s\n", strerror(errno));
    exit(-1);
  }
  printf("PATH=/usr/bin:.\n");
  
  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    if (execvp("echoargs", myargs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);
  
  exit(0);
}
execvpdemo.c

编译该程序,生成并执行文件 execvpdemo,

lienhua34:demo$ gcc -o execvpdemo execvpdemo.c
lienhua34:demo$ ./execvpdemo
PATH=/usr/local/texlive/2013/bin/i386-linux:/usr/local/texlive/2013/bin/i386-linux:/usr/lib/lightdm/lightdm:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games
execve error: No such file or directory
PATH=/usr/bin:.
arg1: hello

从上面的运行结果,我们看到在原始的 PATH 环境变量中没有包含当前目录,于是调用 execvp 函数失败,提示找不到 echoargs 文件。而当将PATH 环境变量设置为“/usr/bin:.”之后,调用 execvp 函数能够正常执行echoargs 文件。

4 exec 函数的其他性质

在调用 exec 函数新程序之后,新进程会保留 exec 之前进程的大多数特征。但是,有几个需要特殊说明一下:有效用户 ID、有效组 ID 和文件描述符。

在执行 exec 前后进程的实际用户 ID 和实际组 ID 保持不变,而有效用户 ID 和有效组 ID 是否改变跟要执行的程序文件的设置用户 ID 和设置组 ID 位有关。如果要执行的程序文件的设置用户 ID 位没有设置,则有效用户 ID 不变;否则,执行 exec 之后,进程的有效用户 ID 将被设置为要执行的程序文件的所有者。(对于有效组 ID 的情况类似。)

在文档“fcntl 函数访问已打开文件的性质”中,我们提到打开的文件描述符都有一个执行时关闭标志(close-on-exec),该标志跟调用 exec 时是否要关闭该文件描述符有关。若某个打开的文件描述符设置了执行时关闭标志,则在执行 exec 函数时会将该描述符关闭,否则该描述符保持不变。文件描述符的执行时关闭标志默认是不设置的。

POSIX.1 明确要求在执行 exec 时关闭打开的目录流。这通常是由opendir 函数实现的,它调用 fcntl 函数为对应打开目录流的文件描述符设置执行时关闭标志。

(done)

posted on 2014-10-07 15:11  lienhua34  阅读(3361)  评论(0编辑  收藏  举报

导航