美文网首页从 0 开始学习 Linux 系列程序员
从 0 开始学习 Linux 系列之「17.进程控制」

从 0 开始学习 Linux 系列之「17.进程控制」

作者: 登龙zZ | 来源:发表于2017-08-07 19:36 被阅读94次
    进程控制

    版权声明:本文为 cdeveloper 原创文章,可以随意转载,但必须在明确位置注明出处!

    前言

    这篇文章主要介绍 Linux 系统中进程控制相关的 API,包括创建,执行,终止等操作。基本的进程相关的概念在上一篇文章中已经介绍过了,不太熟悉的可以再回去了解了解。

    进程标识

    每个进程都有一个非负整数表示的唯一的进程 ID,因为进程 ID 标识符总是唯一的,所以常常把 ID 作为其他标识符的一部分用来保证唯一性,并且进程的 ID 也是可以复用的,当一个进程终止后,其进程 ID 就可能被其他刚创建的进程所使用。

    Linux 系统提供了一些获取进程 ID 的函数:

    #include <sys/types.h>
    #include <unistd.h>
    
    // 得到当前进程 ID
    pid_t getpid(void);
    
    // 得到父进程 ID
    pid_t getppid(void);
    

    这两个函数比较简单,就是直接调用然后输出即可,可以自己尝试输出试试。

    进程的 system 接口

    我们在 Windows 下有 system 接口可以使用,例如打开记事本:

    system("notepad");
    

    同样在 Linux 下也有这个接口,可以执行相关的程序:

    #include <stdlib.h>
    
    // 调用 fork 函数执行 command 命令
    int system(const char *command);
    

    例如,使用 system 接口来执行 ls 命令:

    #include <stdio.h>
    #include <stdlib.h>
    
    int main() {
        // 调用 ls
        system("ls");
        return 0;
    }
    

    system 接口底层其实还是使用系统调用 fork,exec,waitpid 来执行程序,只是在上层又封装了一次。

    创建进程 fork

    fork 的定义

    在 Linux 中,我们使用 fork 来创建一个子进程:

    #include <unistd.h>
    
    pid_t fork(void);
    

    fork 的返回值

    fork 函数有些特殊,成功它返回 2 次,失败返回 -1,利用这个特性可以判断当前的进程是子进程还是父进程

    1. 在子进程中返回 0
    2. 在父进程中返回子进程的进程 ID
    // test_fork1.c
    
    #include <stdio.h>
    #include <unistd.h>
    
    int main() {
        pid_t pid = fork();
    
        if (-1 == pid) 
            perror("fork fail");
        else if (0 == pid) // 子进程返回 0
            printf("I'm child process: %d\n", getpid());
        else // 父进程返回子进程 PID
            printf("I'm parent process,fork return is: %d\n", pid);
    
        return 0;
    }
    

    我们编译运行看看效果:

    # 编译
    gcc test_fork1.c -o test_fork1
    
    # 运行
    ./test_fork1
    I'm parent process,fork return is: 12557
    I'm child process: 12557
    

    可以看到父进程的返回值是子进程的 PID:12557,子进程的 PID 正是 12557,这也验证了 fork 的返回值的特点。

    fork 的写时复制技术

    通过执行 fork,子进程得到父进程的一个副本,例如子进程获得父进程的数据空间,堆和栈的副本,但是它们并不共享存储空间,它们只共享代码段。但是在现在的系统实现中,并不执行拷贝父进程的副本,作为替代方案,而是使用写时复制(Copy - On - Write)技术。

    写时复制:在 fork 之后,这些区域由父子进程共享,而且内核将它们的访问权限改变为只读,如果父子进程中的任何一个试图修改这些区域,内核只为修改区域的那片内存制作一个副本给子进程。

    不管是哪种技术实现,最后父子进程的数据都是独立的,不会相互影响,我们来看一个实际的例子:

    // test_fork2.c
    
    #include <stdio.h>
    #include <unistd.h>
    
    int main() {
        int count = 0;
    
        // 创建子进程
        pid_t pid = fork();
        
        // 父子进程中都有这个变量
        count++;
    
        if (-1 == pid)
            perror("fork fail");
        else if (0 == pid) // 子进程 count 变量
            printf("child process count: %d\n", count);
        else // 父进程 count 变量
            printf("parent process count: %d\n", count);
    
        return 0;
    }
    
    

    编译运行:

    # 编译
    gcc test_fork2.c -o test_fork2
    
    # 运行
    ./test_fork2
    parent process count: 1
    child process count: 1
    

    结果是父子进程中的 count = 1,如果父子进程的 count 不独立的话,子进程的 count 应该等于 2,但是实际上是等于 1,说明父子进程的数据是独立的。

    子进程的执行位置

    fork 还有一个特点:子进程不是从 main 函数开始执行的,而是从 fork 返回的地方开始,我们来看个实际的例子:

    // test_fork3.c
    
    #include <stdio.h>
    #include <unistd.h>
    #include <sys/types.h>
    
    int main(void) {
        int ret_from_fork = 0;
        int mypid = getpid();
    
        printf("Before: my pid is %d\n", mypid);
        
        // 创建子进程,子进程从这里返回
        ret_from_fork = fork();
    
        sleep(1);
    
        printf("After: my pid is %d, fork() said %d\n", getpid(), ret_from_fork);
        return 0;
    }
    

    编译运行结果:

    # 编译
    gcc test_fork3.c -o test_fork3
    
    # 运行
    ./test_fork3
    Before: my pid is 9670
    After: my pid is 9670, fork() said 9671
    After: my pid is 9671, fork() said 0
    

    看到只打印一个 Before 信息,没有打印 2 个 Before 原因是:内核通过复制父进程 9670 来创建子进程 9671,并将父进程 9670 代码和当前运行到的位置都复制到子进程 9671,所以新的子进程 9671 从 fork 返回的地方开始运行,而不是从头开始,也就不会打印开头的 Before 了。

    创建进程 vfork

    还有一个创建进程的系统调用 vfork,它跟 fork 很相似,但是也有几点不同:

    1. vfork 的目的是创建一个子进程来运行一个程序
    2. vfork 并不复制父进程地址空间,子进程在父进程地址空间中运行,并阻塞父进程直到子进程返回
    3. vfork 保证子进程先运行
    4. 子进程需要调用 exec 或 exit 函数退出,否则会带来未知结果。

    来看个实际的例子:

    // test_vfork.c 
    
    #include <stdio.h>
    #include <unistd.h>
    #include <stdlib.h>
    
    int main() {
        int count = 0;
        pid_t pid = vfork();
        count++;
    
        if (-1 == pid) {
            perror("fork fail");
        } else if (0 == pid) {
            printf("child process count : %d\n", count);
            exit(0);
        } else {
            // 父进程会阻塞
            printf("parent process count: %d\n", count);
        }
        
        return 0;
    }
    

    编译运行:

    # 编译
    gcc test_vfork.c -o test_vfork
    
    # 运行
    ./test_vfork
    child process count: 1
    parent process count: 2
    

    这个结果跟前面使用 fork 的例子是不同的,使用 vfork 先打印的子进程信息,再打印父进程的信息,是因为父进程被阻塞了,直到子进程执行完了才有机会执行。并且由于子进程在父进程的地址空间中运行,所以子进程中对 count 加一的操作对父进程也是有效的,因此最后父进程的 count = 2

    exec

    fork 函数里面最后也是调用 exec 等函数来执行程序的,我们有必须要了解这个函数:

    #include <unistd.h>
    
    // path:程序名称,argv:运行参数
    int execv(const char *path, char *const argv[]);
    

    exec 有很多变种函数,例如 execlpexecle,等等,但基本的用法都是差不多的,这里就以 execl 为例来看个程序:

    #include <stdio.h>
    #include <unistd.h>
    
    int main() {
        char* argvs[] = {"ps", "-ef", NULL};
        execv("ps", argvs);
        return 0;
    }
    

    运行结果就相当与 shell 命令:ps - ef,其他的变种函数可以通过 man exec 来查看。

    进程等待 wait

    父进程可以使用 wait 系统调用主动等待子进程或者指定进程结束,并获得子进程的结束信息

    #include <sys/types.h>
    #include <sys/wait.h>
    
    // 等待子进程结束
    pid_t wait(int *wstatus);
    
    // 等待指定的 PID 进程结束
    pid_t waitpid(pid_t pid, int *wstatus, int options);
    

    这个系统调用的过程如下:

    1. wait 暂停调用它的进程直到子进程结束
    2. wait 调用成功返回子进程的 PID
    3. wstatus 存储子进程的返回信息(正常退出,异常退出,被信号杀死),以此来知道子进程是如何结束的

    大致的流程如下:

    F ---fork------> F -------- wait ----> F ------------->
            |                              |
            |                              |
            |                              |
            -------> C -------------exit() -
    

    来看看 wait 是如何使用的:

    // test_wait.c
    
    #include <stdio.h>
    #include <stdlib.h>
    #include <unistd.h>
    #include <sys/wait.h>
    
    int main() {
        int status = 0;
        pid_t pid = fork();
        if (0 == pid) {
            printf("child process\n");
            sleep(3);
            // 父进程会得到 exit 的退出状态码
            exit(0);
        } else if(pid > 0) {
            // 等待子进程返回,wait 运行成功返回子进程 PID
            if (pid == wait(&status))
                printf("child has run ok status = %d, parent processing...\n", status);
        }
    
        return 0;
    }
    
    

    编译运行:

    # 编译
    gcc test_wait.c -o test_wait
    
    # 运行
    ./test_wait
    child process
    child has run ok status = 0, parent processing...
    

    可以看到父进程成功等待了子进程 3 s,并得到了存储在 status 中的返回值,这个 status 有 2 种状态:

    1. 如果子进程调用 exit 退出,那么内核将 exit 的退出状态码放在 status 中
    2. 如果进程被杀死,内核将信号序列放在 status 中

    实际使用时,wait 提供了相关的宏来判断 status 的状态,详情参考 man wait。另外 waitpidwait 几乎的相同的,作为锻炼,就留给你自己去学习吧,参考 man waitpid

    进程结束

    既然能够创建进程,那肯定能够结束进程,在 Linux 中进程退出又分为正常和异常退出,分别来了解了解。

    正常退出

    有 5 种正常退出进程的方法:

    1. 在 main 内执行 return,等价于调用 exit
    2. 调用 exit
    3. 调用 _exit_Exit
    4. 进程的最后一个线程在其启动例程中执行 return 语句
    5. 进程的最后一个线程调用 pthread_exit 函数

    异常终止

    有 3 种异常终止的方法:

    1. 调用 abort,产生 SIGABRT 信号
    2. 当进程接受到某些信号时
    3. 最后一个线程对「取消」请求作出响应

    不管是哪种终止情况,我们都可以使用 wait 或者 waitpid 来得到子进程的退出状态。

    拓展:在 Linux 内核中查看 fork 执行流程

    为了加深对 Linux 进程的理解,下面就来简单了解下 fork 在内核中的具体调用过程。建议你用源码查看工具来跟踪源码,我使用的是 Linux-2.6 的源码,要跟踪的文件是 kernel/fork.c,创建进程的总体过程如下图所示:

    fork

    总体的流程是创建一个新的任务(task_struct),然后拷贝相关的进程信息,最后唤醒这个进程和后续的准备工作,其中最重要的是 copy_process 这个函数,来看看它的具体执行过程:

    copy_process

    主要的流程就是先使用 dup_task_struct 复制一个进程结构,然后初始化这个进程信息,再拷贝父进程的相关信息,最后 sched_fork 调度进程。

    整个过程大体上就是这样,具体的细节有兴趣可以深入的跟踪,这里就介绍这些了。

    结语

    本次我们学习了 Linux 中非常重要的进程控制,其中非常重要的是 fork 这个函数,因为我们就是用这个函数来创建进程的,另外我们也在内核中分析了 fork 的具体实现过程,希望通过这篇文章能够让你对 Linux 的进程有一个更加完整的了解和学习,希望你能认真实践。

    最后,感谢你的阅读,我们下次再见 :)

    相关文章

      网友评论

        本文标题:从 0 开始学习 Linux 系列之「17.进程控制」

        本文链接:https://www.haomeiwen.com/subject/ssnalxtx.html