【Linux进程控制】四、exec函数族——进程替换详解

2024-08-08 17:09:54 浏览数 (3)

1. 进程替换的概念

我们在使用fork()系统调用之后,创建出来的子进程是对父进程的复制,也就是说子进程和父进程执行的是相同的程序,虽然说父子进程可能执行的是不同的代码分支(if else语句),但是程序流程是一样。我们要想在新创建的子进程中执行其他程序,需要调用一种exec函数来拉起一个新的进程。当进程调用一种exec函数的时候,该进程的用户空间代码和数据全部被新程序替换掉,从新程序的启动例程开始执行。需要注意的是,调用exec并不会创建新进程,而是一种进程替换,所以调用exec前后,进程本身的ID不会改变。

调用exec函数的时候,会把当前进程的 .text 和 .data 替换为所要加载的程序的 .text 和 .data ,然后让进程从新的进程的 .text 段的第一条指令开始执行,但是进程ID不变,也就是说壳子没变,但壳子里的东西变了。

exec开头的函数总共有6种,统称exec函数族,下面着重介绍exec函数族种中重要的几个函数原型。

2. exec函数族函数原型介绍

  • 包含头文件及函数原型
代码语言:javascript复制
#include <unistd.h>

extern char **environ;

int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg,
                  ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
  • 函数族介绍 The exec() family of functions replaces the current process image with a new process image. 用新的进程映像替换原来的进程映像。exec函数族的命令是有一定的规律的,l表示list,就是参数列表的意思;p代表PATH,所以带p的参数都是file,不带p的参数都是path;e代表环境变量,我们可以设置这个环境变量,比如execle()有一个参数envp[]就是设置环境变量的;v表示vector,我们可以把参数放到一个数组中,然后把数组传给execv()。
  • 函数参数
    • path:
    • file:要执行的程序名。
    • arg:参数列表,最后需要一个NULL作为结尾,这个NULL实际上就是一个哨兵,来告诉程序参数列表到此结束。另外参数arg是从arg[0]开始的,而arg[0]是这个程序本身,所以在写参数列表的时候需要先写一个程序本身来占位(实际上是个占位参数)。
  • 返回值 If any of the exec() functions returns, an error will have occurred. The return value is -1, and errno will be set to indicate the error. exec函数只有在出错的时候才会返回,如果不出错就不会再返回回来了。

这里面重要的是前两个execl和execlp函数,它们都用于使用一个新的进程去替换原来的进程,也就是在新创建的进程中执行其他程序。execlp中的p是指PATH环境变量,在执行程序的时候execlp会使用PATH环境变量,这样在执行程序的时候就可以不用加路径了,因为它使用了环境变量PATH,通过这个环境变量就能够找到路径,而execl就需要加路径,通过它们的第一个参数也能看出来,execl第一个参数是path,而execlp第一个参数是file。

示例:通过execlp函数使用来演示exec函数的返回值和参数

代码语言:javascript复制
/************************************************************
  >File Name  : exec_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月19日 星期四 19时36分51秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main(int argc, char* argv[])
{
    execlp("ls"/*用ls代替当前main进程*/, "ls"/*占位参数*/, 
                 "-lrt"/*参数列表,ls进程的参数*/, NULL/*哨兵,参数列表结束标志*/);
    
    /*只有出错才会返回,如果不出错的话,就不会再返回该程序*/
    perror("execlp err");
    
    /*测试execlp成功式是否会返回,如果这句话没有打印,说明没有返回*/
    printf("test...n");
    return 0;
}

这样我们在执行exec_test程序的时候会被直接替换为 ls -lrt 进程,并且我们的测试语句printf没有打印,这说明execlp()函数执行成功后不会返回。你可能会奇怪,这样执行的ls和直接在shell下执行ls不太一样,它没有用颜色区分出可执行文件(绿色),实际上shell下的ls是一个别名,别名中使用了自动颜色的参数

如果用execl()函数去实现,就要加路径名

代码语言:javascript复制
int main()
{
    /*根据写入的路径去搜索要执行的程序*/
    execl("/bin/ls", "ls", "-l", "--color=auto", NULL);
    return 0;
}

3. exec函数族的调用关系

我们在上面列出的5个exec函数最终都会调用execve系统调用,我们在查man手册的时候也能发现,上面5个在第3章,使用 man 3 execl 就可以把5个函数一块查到,而execve是一个系统调用,它在第二章。

代码语言:javascript复制
#include <unistd.h>

int execve(const char *filename, char *const argv[],
                  char *const envp[]);

4. shell进程执行命令的原理

exec函数族的作用使用了替换进程的,但是exec函数有个特点就是,一旦执行成功就不会再返回了。试想一下,加入我们在shell下拉起一个进程,成功后就直接去到其它进程了,而不会再返回shell进程,这显然是不可行的。实际上shell是先fork()一个进程,然后在fork()创建的子进程中使用exec函数来拉起一个其它进程,这样fork()后的两个进程有一个是shell进程,一个是我们需要执行的进程,这才是exec函数的应用场景,也就是说exec函数族是和fork()函数一块使用的。实际上这也是shell执行命令的原理。

0 人点赞