goroutine代表着并发编程模式中的用户级线程。
操作系统本身提供了进程和线程这两种并发执行程序的工具。进程,描述的就是程序的执行过程,是运行着的程序的代表。线程,总是在进程之内的,可以被视为进程中运行着的控制流(或者说代码执行的流程)。
一个进程至少会包含一个线程。如果一个进程只包含一个线程,那么它里面的所有代码都会被串行地执行。每个进程的第一个线程都会随着该进程的启动而被创建,它们可以被称为其所属进程的主程序。
相对应的,如果一个进程中包含了多个线程,那么其中的代码可以被并发地执行。除了进程的第一个线程之外,其他的线程都是由进程中已存在的线程创建出来的。
也就是说,主线程之外的其他线程只能由代码显式地创建和销毁。这需要我们在编写程序的时候进行手动控制,操作系统以及进程本身并不会帮我们下达这样的指令,它们只会忠实地执行我们的指令。
不过,在Go程序中,Go语言的运行时(runtime)系统会帮组我们自动地创建和销毁系统级的线程。这里的系统级线程指的就是我们刚刚说过的操作系统提供的线程。
而对应的用户级线程指的是架设在系统级线程之上的,由用户(或者说我们编写的程序)完全控制的代码执行流程。用户级线程的创建、销毁、状态变更以及其中的代码和数据都完全需要我们的程序自己去实现和处理。
这带来了很多优势,比如,因为它们的创建和销毁并不用通过操作系统去做,所以速度会很快,又比如,由于不用等着操作系统去调度它们的运行,所以往往会很容易控制并且可以很灵活。
但是,劣势也是有的,最明显也最重要的一个劣势就是复杂。如果我们只使用了系统级线程,那么我们只要指明需要新线程执行的代码片段,并且下达创建或销毁线程的指令就好啦,其他的一切具体实现都会由操作系统代劳的。
但是,如果使用用户级线程,我们就不得不既是指令下达者,又是指令执行者。我们必须全权负责与用户级线程有关的所有具体操作。
操作系统不但不会帮忙,还会要求我们的具体实现必须与它正确地对接,否则用户级线程就无法被并发地,甚至正确地运行。
不过别担心,Go语言不但有独特的并发编程模型,以及用户级线程goroutine,还拥有强大的用于调度goroutine、对接系统级线程的调度器。
这个调度器是Go语言运行时系统的重要组成部分,它主要负责统筹调配Go并发编程模型中的三个主要元素。即:G(goroutine 的缩写)、P(processor的缩写)和M(machine的缩写)。
其中的M指代的就是系统级线程。而P指的是一种可以承载若干个G,且能够使这些G适时地与M进行对接,并得到真正运行的中介。
从宏观上说,G和M由于P的存在可以呈现出多对多的关系。当一个正在与某个M对接并运行着的G,需要因某个事件(比如等待I/O或锁的解除)而暂停运行的时候呀,调度器总会及时地发现,并把这个G与那个M分离开,以释放计算资源提供那些等待运行的G使用。
而当一个G需要恢复运行的时候,调度器又会尽快地为它寻找空闲的计算资源(包括M)并安排运行。另外,当M不够用时,调度器会帮我们向操作系统申请新的系统级线程,而当某个M已无用时,调度器又会负责把它及时地销毁掉。
正因为调度器帮组我们做了很多事,所以我们的Go程序才总是能高效地利用操作系统和计算机资源。程序中的所有goroutine也都会被充分地调度,其中的代码也都会被并发地运行,即使这样的goroutine有数以万计,也仍然可以如此。
demo:
package main
import "fmt"
func main() {
for i:=0; i<10; i++ {
go func() {
fmt.Println(i)
}()
}
}
结果:不会有任何内容被打印。
原因:与一个进程总会有一个主线程类似,每一个独立的Go程序在运行时也总会有一个主goroutine。这个主goroutine会在Go程序的运行准备工作完成后被自动地启用,并不需要我们做任何手动的操作。
每条go语言一般都会携带一个函数调用,这个被调用的函数常常被称为go函数,而主goroutine的go函数就是那个作为程序入口的main函数。
一定要注意,go函数真正被执行的时间总会与所属的go语句被执行的时间不同。当程序执行到一条go语句时,Go语言的运行时系统,会试图从某个存放空闲的G队列中获取一个G(也就是goroutine),它只有在找不到空闲G的情况下才会去创建一个新的G.
这也就是为什么说“启用”一个goroutine而不说“创建”一个goroutine的原因。已存在的goroutine总是会被有限复用。
然后,创建G的成本也是非常低的。创建一个G并不会像新建一个进程或者一个系统级线程那样,必须通过操作系统的系统调用来完成,在Go语言的运行时系统内部就可以完全做到了,更何况一个G仅相当于需要并发执行代码片段服务的上下文环境而已。
在拿到了一个空闲的G之后,Go语言运行时系统会用这个G去包装当前的那个go函数(或者说该函数中的那些代码),然后再把这个G追加到某个存放可运行的G的队列中。
这类队列中的G总是会按照先入先出的顺序,很快地由运行时系统内部的调度器安排运行。虽然这会很快,但是由于上面所说的那些准备工作还是不可避免的,所以耗时还是存在的。
因此,go函数的执行时间总是会明显滞后于它所属的go语句的执行时间。
在demo中,一旦主goroutine中的代码执行完毕,当前的Go程序就会结束运行。还未运行的goroutine就会关闭。
但是,Go程序并不会去保证这些goroutine会以怎样的顺序运行。由于主goroutine会与我们手动启用的其他goroutine一起调度,又因为调度器有可能会在goroutine的代码只执行了一部分的时候暂停,以期所有的goroutine有更公平的运行机会。
所以哪个goroutine先执行完,哪个goroutine后执行完往往是不可预知的,除非我们使用了某种Go语言提供的方式进行人为干预。
所以,demo的结果:绝大部分情况下丢失不会有任何内容打印出来,但不排除少部分情况有内容打印,如:10个9,乱序的0-9
网友评论