上节课我们学习了几个重要Linux命令,其实Linux命令也是一个程序,只不过代码是别人写的,我们直接拿过来用就好啦。
不过,无论是别人写的程序还是我们自己写的程序,运行起来都是进程。一个进程的运行需要使用操作系统的系统调用服务,系统调用决定了这个操作系统好不好用、功能全不全。
1进程管理
前面我们有开玩笑说给扣扣立项,其实对应到Linux操作系统中就是创建进程。
创建进程的系统调用叫做fork,它的中文叫“分支”,为啥启动一个新教程要叫“分支”呢?
在Linux中,要创建一个新的进程,需要一个老的进程调用fork来实现,其中老的进程叫做父进程,新的进程叫做子进程。
当父进程调用fork创建进程的时候,子进程将各个[子系统为父进程创建的数据结构](这个断句很容易断错,嘿嘿)也全部拷贝了一份,甚至连程序代码也是拷贝过来的。
但是如果父进程和子进程都按相同的程序代码进行下去,就完全没有意义了,所以我们会做一个特殊处理:对于fork系统调用的返回值,如果当前进程是子进程,就返回0;如果当前进程是父进程,就返回子进程的进程号。这样首先在返回值里就有了一个区分,然后通过if-else判断,如果是父进程,还接着做原来应该做的事情;如果是子进程,需要请求另一个系统调用execve来执行另一个程序,这个时候,子进程和父进程就彻底分道扬镳了,也即产生了一个分支(fork)了。
那么问题来了,既然新进程都是父进程fork出来的,那么第一个进程是谁捏?
在操作系统中,启动的时候会先创建一个所有用户进程的“祖宗进程”,后面会详细讲~
有时候父进程要关心子进程的运行情况,有个系统调用waitpid,父进程可以调用它,将子进程的进程号作为参数传给它,这样父进程就知道子进程运行完了没有,成功与否。
嘻嘻,举个例子,一个公司里有新员工要入职,肯定要填各种表呀走各种流程之类的,这时从上级的老员工的表单fork一个模板出来,然后新员工再进行相应的自己的修改。然后公司的第一个员工肯定是老板自己啦,他就相当于那个“祖宗进程”。然后老板或者新员工的上级老员工还要对自己的员工负责,所以会关心他的进度~
2内存管理
进程启动之后,每个进程都有自己的独立的内存空间呢,互相之间不干扰,叫做进程内存空间。
这个独立的进程内存空间里,都会放些什么呢?
对于进程来说,它执行所需依据的程序代码肯定要放进去,这一部分我们称为代码段。
另外进程在运行的过程中会产生数据,这部分我们称为数据段。其中局部变量的部分,在当前函数执行的时候起作用,当进入另一个函数时,这个变量就释放了;也有动态分配的,会较长时间保存,指明才销毁的,这部分称为堆(Heap)。
一个进程的内存空间是很大的,32位的有4G,64位的就更大了,我们不可能有这么多物理内存,它都是需要的时候再分配的。所以,进程要去使用部分内存的时候,才会使用内存管理的系统调用来做登记,说自己马上要用啦,需要分一部分内存给它,而且就算这样也不代表真的就对应到了物理内存,只有真的写入数据的时候,发现没有对应的物理内存,才会触发一个中断,现分物理内存。
这里介绍两个堆里面分配内存的系统调动,brk和mmap。
当分配的内存数量比较小的时候,使用brk,回合原来的堆的数据连在一起,就像给原来办公室多搬两把椅子一样;当分配的内存数量比较大的时候,使用mmap,会重新划分一块区域,也就是说,当办公空间需要太多的时候,索性划分一整块新的办公室。
3文件管理
在操作系统中,我们的程序、文档、照片等等这些文件,即使关机再开机也不能丢掉的,所以需要将它放在文件系统中。
文件之所以可以做到这一点,一方面是因为介质,另一方面是因为格式。
文件管理其实花样不多,无非就是创建、打开、读、写等。
对于文件的操作,下面这六个系统调用是最重要的:
1.对于已经有的文件,可以用open打开这个文件,close关闭这个文件。
2.对于没有的文件,可以用create创建文件。
3.打开文件以后,可以使用Iseek调到文件的某个位置。
4.可以对文件的内容进行读写,读的系统调用是read,写是write。
在Linux操作系统中,有一个重要的特点就是,一切皆文件。
比如:
启动一个进程,需要一个程序文件,这是一个二进制文件。
启动的时候,要加载一些配置文件,这是文本文件;启动之后会打印一些日志,如果写到硬盘上,也是文本文件。
如果日志打印到交互控制台上,在命令行上刷刷的打印出来,这是一个标准输出stdout文件。
一个进程的输出可以作为另一个进程的输入,这种方式称为管道,管道也是一个文件。
进程可以通过网络和其他进程进行通信,建立的Socket,也是一个文件。
进程需要访问外部设备,设备也是一个文件。
文件都被存储在文件夹里面,文件夹也是一个文件。
进程运行起来,要想看到进程运行的情况,会在/proc下面有对应的进程号,还是一系列文件。
每个文件,Linux都会分配一个文件描述符,这是一个整数。有了这个文件描述符,我们就可以使用系统调用,查看或者干预进程运行的方方面面。
所以说文件操作是贯穿适中的,这也是“一切皆文件”的优势,统一了操作的入口,提供了极大的便利。
4信号处理
当进程遇到异常情况,就需要发送一个信号,经常遇到的信号有以下几种:
在执行一个程序的时候,在键盘输入“CTRL+C”,这就是中断的信号,正在执行的命令就会终止退出。
非法访问内存,比如不小心访问到别人家进程的内存空间。
硬件故障。
用户进程通过kill函数,将一个用户信号发送给另一个进程。
当“项目组”收到这些信号的时候,需要决定如何处理这些异常情况~
对于一些不严重的信号可以忽略,该干啥干啥,但是像SIGKILL(用于终止一个进程的信号)和SIGSTOP(用于中止一个进程的信号)是不能忽略的,可以执行对于该信号的默认动作。
每种信号都定义了默认的动作,例如硬件故障的默认动作是终止。
也可以提供信号处理函数,可以通过sigaction系统调用,注册一个信号处理函数。
有了信号处理服务,进程执行过程中一旦有变动,就可以及时的处理啦!
5进程间通信
进程间的沟通方式有很多种。
首先就是发个消息,这种方式称为消息队列。我们可以通过msgget创建一个新的队列,msgsnd将消息发送到消息队列,而消息接收方可以使用msgrcv从队列中取消息。
当两个项目组需要交互的信息比较大的时候,可以使用共享内存的方式。我们可以通过shmget创建一个共享内存块,通过shmat将共享内存映射到自己的内存空间,然后就可以读写了。但是共享内存的时候要注意,如果大家同时修改同一数据块就很容易出问题,所以要用到信号量的机制Semaphore,让不同的进程能够排他地访问。
6网络通信
不同的操作系统间的通信是通过网络通信进行的,他们要遵循相同的网络协议,也即TCP/IP网络协议栈。Linux内核里有对于网络协议栈的实现。那么它是如何暴露出服务给项目组使用捏?
网络服务是通过套接字Socket来提供服务的。Socket可以作“插口”或者”插槽“讲。我们可以想象一个画面,弄一根网线,一头插在客户端,一头插在服务端,然后进行通信。因此,在通信之前,双方都要建立一个Socket。
我们可以通过Socket系统调用建立一个Socket,Socket也是一个文件,也有一个文件描述符,也可以通过读写函数进行通信。
好了,今天我们主要就了解一下这六个系统调用,但是这只是很小的一部分,实际上Linux中的系统调用非常多,我们可以在https://www.kernel.org下载一份Linux内核源码。
7Glibc“中介”
做过开发的小伙伴应该都发现了,刚才讲的系统调用和我们平时调用的函数不太样。这是因为,我们平常并没有直接使用系统调用,而是使用的“中介”,这个中介就是Glibc。
有了Glibc,有事情找它就行,它会转换成为系统调用,帮我们调用。
Glibc是Linux下使用的开源的标准C库,它是GNU发布的libc库。Glibc为程序员提供丰富的API,除了例如字符串处理、数学运算等用户态服务外,最重要的是封装了操作系统提供的系统服务,即系统调用的封装。
每个特定的系统调用对应了至少一个Glibc封装的库函数,比如说,系统提供的打开文件系统调用sys_open对应的是Glibc中的open函数。
有时Glibc一个单独的API可能调用多个系统调用,比如Glibc提供的printf函数就会调用如sys_open、sys_mmap、sys_write、sys_close等等系统调用。
也有时多个API可能只对应同一个系统调用,如Glibc下实现的malloc、calloc、free等函数用来分配和释放内存,都利用了内核的sys_brk的系统调用。
8总结
话不多述,看图~
网友评论