Go语言并发机制初探

go 语言相比java等一个很大的优势就是可以方便地编写并发程序。go 语言内置了 goroutine 机制，使用goroutine可以快速地开发并发程序，更好的利用多核处理器资源。这篇文章学习 goroutine 的应用及其调度实现。

使用 go 关键字用来创建 goroutine 。将go声明放到一个需调用的函数之前，在相同地址空间调用运行这个函数，这样该函数执行时便会作为一个独立的并发线程。这种线程在go语言中称作goroutine。

goroutine的用法如下：

因为 goroutine 在多核 cpu 环境下是并行的。如果代码块在多个 goroutine 中执行，我们就实现了代码并行。

如果我们需要了解程序的执行情况，怎么拿到并行的结果呢？需要配合使用channel进行。

channels用来同步并发执行的函数并提供它们某种传值交流的机制。

通过channel传递的元素类型、容器（或缓冲区）和传递的方向由“<-”操作符指定。

可以使用内置函数 make分配一个channel:

使用下面的代码可以显式的设置是否使用多核来执行并发任务：

gomaxprocs的数目根据任务量分配就可以，但是不要大于cpu核数。

配置并行执行比较适合适合于cpu密集型、并行度比较高的情景，如果是io密集型使用多核的化会增加cpu切换带来的性能损失。

了解了go语言的并发机制，接下来看一下goroutine 机制的具体实现。

在现代操作系统中，线程是处理器调度和分配的基本单位，进程则作为资源拥有的基本单位。

每个进程是由私有的虚拟地址空间、代码、数据和其它各种系统资源组成。线程是进程内部的一个执行单元。

每一个进程至少有一个主执行线程，它无需由用户去主动创建，是由系统自动创建的。

用户根据需要在应用程序中创建其它线程，多个线程并发地运行于同一个进程中。

并行与并发（concurrency and parallelism）是两个不同的概念，理解它们对于理解多线程模型非常重要。

在描述程序的并发或者并行时，应该说明从进程或者线程的角度出发。

并发：一个时间段内有很多的线程或进程在执行，但何时间点上都只有一个在执行，多个线程或进程争抢时间片轮流执行

并行：一个时间段和时间点上都有多个线程或进程在执行

非并发的程序只有一个垂直的控制逻辑，在任何时刻，程序只会处在这个控制逻辑的某个位置，也就是顺序执行。如果一个程序在某一时刻被多个cpu流水线同时进行处理，那么我们就说这个程序是以并行的形式在运行。

并行需要硬件支持，单核处理器只能是并发，多核处理器才能做到并行执行。

并发是并行的必要条件，如果一个程序本身就不是并发的，也就是只有一个逻辑执行顺序，那么我们不可能让其被并行处理。

并发不是并行的充分条件，一个并发的程序，如果只被一个cpu进行处理(通过分时)，那么它就不是并行的。

举一个例子，编写一个最简单的程序输出"hello world"，它就是非并发的，如果在程序中增加多线程，每个线程打印一个"hello world"，那么这个程序就是并发的。运行时只给这个程序分配单个cpu，这个并发程序还不是并行的，需要用多核处理器的操作系统来运行它，才能实现程序的并行。

线程的实现可以分为两类：用户级线程(user-levelthread, ult)和内核级线程(kemel-levelthread, klt)。用户线程由用户代码支持，内核线程由操作系统内核支持。

多线程模型即用户级线程和内核级线程的不同连接方式。

将多个用户级线程映射到一个内核级线程，线程管理在用户空间完成。

此模式中，用户级线程对操作系统不可见（即透明）。

优点：

这种模型的好处是线程上下文切换都发生在用户空间，避免的模态切换（mode switch），从而对于性能有积极的影响。

缺点：所有的线程基于一个内核调度实体即内核线程，这意味着只有一个处理器可以被利用，在多处理环境下这是不能够被接受的，本质上，用户线程只解决了并发问题，但是没有解决并行问题。

如果线程因为 i/o 操作陷入了内核态，内核态线程阻塞等待 i/o 数据，则所有的线程都将会被阻塞，用户空间也可以使用非阻塞而 i/o，但是还是有性能及复杂度问题。

将每个用户级线程映射到一个内核级线程。

每个线程由内核调度器独立的调度，所以如果一个线程阻塞则不影响其他的线程。

优点：在多核处理器的硬件的支持下，内核空间线程模型支持了真正的并行，当一个线程被阻塞后，允许另一个线程继续执行，所以并发能力较强。

缺点：每创建一个用户级线程都需要创建一个内核级线程与其对应，这样创建线程的开销比较大，会影响到应用程序的性能。

内核线程和用户线程的数量比为 m : n，内核用户空间综合了前两种的优点。

这种模型需要内核线程调度器和用户空间线程调度器相互操作，本质上是多个线程被绑定到了多个内核线程上，这使得大部分的线程上下文切换都发生在用户空间，而多个内核线程又可以充分利用处理器资源。

goroutine机制实现了m : n的线程模型，goroutine机制是协程（coroutine）的一种实现，golang内置的调度器，可以让多核cpu中每个cpu执行一个协程。

理解goroutine机制的原理，关键是理解go语言scheduler的实现。

go语言中支撑整个scheduler实现的主要有4个重要结构，分别是m、g、p、sched，

前三个定义在runtime.h中，sched定义在proc.c中。

sched结构就是调度器，它维护有存储m和g的队列以及调度器的一些状态信息等。

m结构是machine，系统线程，它由操作系统管理的，goroutine就是跑在m之上的；m是一个很大的结构，里面维护小对象内存cache（mcache）、当前执行的goroutine、随机数发生器等等非常多的信息。

p结构是processor，处理器，它的主要用途就是用来执行goroutine的，它维护了一个goroutine队列，即runqueue。processor是让我们从n:1调度到m:n调度的重要部分。

g是goroutine实现的核心结构，它包含了栈，指令指针，以及其他对调度goroutine很重要的信息，例如其阻塞的channel。

processor的数量是在启动时被设置为环境变量gomaxprocs的值，或者通过运行时调用函数gomaxprocs()进行设置。processor数量固定意味着任意时刻只有gomaxprocs个线程在运行go代码。

我们分别用三角形，矩形和圆形表示machine processor和goroutine。

在单核处理器的场景下，所有goroutine运行在同一个m系统线程中，每一个m系统线程维护一个processor，任何时刻，一个processor中只有一个goroutine，其他goroutine在runqueue中等待。一个goroutine运行完自己的时间片后，让出上下文，回到runqueue中。

多核处理器的场景下，为了运行goroutines，每个m系统线程会持有一个processor。

在正常情况下，scheduler会按照上面的流程进行调度，但是线程会发生阻塞等情况，看一下goroutine对线程阻塞等的处理。

当正在运行的goroutine阻塞的时候，例如进行系统调用，会再创建一个系统线程（m1），当前的m线程放弃了它的processor，p转到新的线程中去运行。

当其中一个processor的runqueue为空，没有goroutine可以调度。它会从另外一个上下文偷取一半的goroutine。

go语言的并发机制还有很多值得探讨的，比如go语言和scala并发实现的不同，golang csp 和actor模型的对比等。

了解并发机制的这些实现，可以帮助我们更好的进行并发程序的开发，实现性能的最优化。

关于三种多线程模型，可以关注一下java语言的实现。

我们知道java通过jvm封装了底层操作系统的差异，而不同的操作系统可能使用不同的线程模型，例如linux和windows可能使用了一对一模型，solaris和unix某些版本可能使用多对多模型。jvm规范里没有规定多线程模型的具体实现，1:1（内核线程）、n:1（用户态线程）、m:n（混合）模型的任何一种都可以。谈到java语言的多线程模型，需要针对具体jvm实现，比如oracle/sun的hotspot vm，默认使用1:1线程模型。

Go语言并发机制初探

继续阅读

golang 学习（二十四）结构体struct 和 json之间的转换结构体struct 和 json之间的转换

golang中结构体与jsongolang中结构体与json

golang结构体tag编译错误的问题

Golang结构体中的tag

GO语言笔记--结构体1.说明2.工厂函数

Go语言之map与结构体初入map结构体初入（场景map的value通常为struct）

Go初探 (5) – 结构体与接口

go(7)结构体，方法，接口

Go学习笔记: 结构体、方法、接口

06结构体、接口结构体接口

go语言笔记（结构体、方法、接口）go语言笔记（结构体、方法、接口）

Go中结构体和接口的定义

Rich Domain Model

Docker-compose 进行Doris自动化编排部署

服装信息化数字化变革

Linux之父警告全球程序员：我刚发布的5.12内核有bug，你们千万别用