Goroutine就是协程:进程 线程 协程 各自的概念以及三者的对比分析

2022-10-26 15:09:21 浏览数 (1)

Go语言中的goroutine就是协程

1 进程

概念

进程,直观点说,保存在硬盘上的程序运行之后,会在内存空间里形成一个独立的内存体,这个内存体有自己独立的地址空间,有自己的堆,上级挂靠单位是操作系统。

特点

操作系统会以进程为单位,分配系统资源(CPU时间片,内存等资源),进程是资源分配的最小单位。

示意图

2 线程

概念

线程,有时被称为轻量级进程(LightWeight Process,LWP),是操作系统调度(CPU调度)执行的最小单位。

示意图

3 进程和线程的区别和联系

3.1 区别

调度:

进程作为拥有资源的基本单位,线程作为调度和分配的基本单位。即:进程是资源的拥有者,线程是资源的调度者。

并发性:

不仅进程之间可以并发执行,同一个进程的多个线程也可以并发执行

拥有资源:

  • 进程是拥有资源的基本单位,线程不直接拥有资源。
  • 线程可以访问隶属于进程的资源
  • 进程所维护的是程序所包含的资源(静态资源),比如:地址空间、打开的文件句柄、文件系统状态,信号处理handler
  • 线程所维护的是程序运行相关的资源(动态资源),如:运行栈、调度相关的控制信息、待处理的信号集...

系统开销:

  • 进程的系统开销更大:在创建或者销毁进程时,由于系统需要位置分配和回收资源,导致系统的开销明显大于创建或者销毁线程时的开销。
  • 进程更稳定安全:
    • 进程有独立的内存空间,一个进程崩溃后,在保护模式下对其他进程不会有影响
    • 而线程只是一个进程中的不同的执行路径
  • 线程有自己的堆栈和局部变量,但是线程没有独立的地址空间,一个进程死掉等于该进程下所有的线程死掉。
    • 所以多进程的程序要比多线程的的程序稳健,但在多进程切换时,耗费资源大,性能较差。

3.2 联系

一个线程只能属于一个进程,一个进程可以有多个线程,至少有一个线程

资源分配给进程,同一进程的所有线程共享该进程的所有资源

处理机(中央处理器 主存储器 输入输出设备)分配资源给进程,即真正运行在处理机上的是进程

线程在执行过程中,需要协作同步。不同进程的线程间要利用消息通信的办法实现同步。线程是指进程内的一个执行单元,也是进程内的可调度实体。

4 举例说明进程和线程的区别

这幅图是一个双向多通道的道路图,假如我们把整个道路看做一个“进程”的话,那种图中由白色虚线分割开的车道就是进程中的各个“线程”了。

  1. 这些车道(线程)共享了道路(进程)的土地资源(系统资源)
  2. 这些车道(线程)必须依赖于道路(进程),否则车道将没有意义(线程不能脱离于进程而存在)
  3. 这些车道(线程)之间可以并发运行(各个车道你走你的,我走我的),也可以同步运行(遇到红灯的情况,需要等待特点条件后再执行)
  4. 这些车道(线程)的运行和交通灯(代码逻辑)息息相关,如果交通灯出现问题(代码逻辑问题,比如死锁,多个线程同时竞争同一资源),会造成交通混乱
  5. 这些车道(线程)谁先运行起来是未知的,只有当信号灯变化(分配CPU时间的时候)那刻才知道

这个栗子实在是香,太经典了!

5 进程/线程之间的亲缘性

概念

亲缘性的意思是进程/线程只在某个CPU上运行(多核系统)

好处

使用CPU亲缘性的好处:防止进程/线程在CPU的多核间频繁切换,从而避免因切换带来的CPU的L1/L2 cache失效,cache失效会降低程序的性能。

6 协程

示意图

概念

  • 协程,是一个比线程更轻量级的存在,协程完全由程序控制(也就是在用户态执行)
    • 协程不被操作系统内核所管理
    • 协程能极大的提升性能,不会像线程切换那样消耗资源
  • 子程序,又称为“函数”。
    • 在所有语言中都是层级调用的,A调用B,B调用C,C执行完毕返回,B执行完毕返回,最终A执行完毕
    • 由此可见,子程序调用是通过栈实现的,一个线程就是执行一个子程序。

线程(执行一个函数)和协程的区别和联系

  • 函数总是一个入口,一个返回,调用顺序是明确的(一个线程就是执行一个函数)
  • 而协程的调用和函数不同,协程在函数内部是可以中断的,可以转而执行别的函数,在适当的时候再返回来接着执行。
代码语言:javascript复制
def A(){
    print 1
    print 2
    print 3
}

def B(){
    print 'x'
    print 'y'
    print 'z'
}
  • 比如上面代码如果是协程执行,在执行A的过程中,可以中断去执行B,在执行B的时候亦然。结果可能是:1 x y 2 3 z
  • 同样上面的代码如果是线程执行,只能执行完A再执行B,或者执行完B再执行A,结果只可能是2种:1 2 3 x y z 或者 x y z 1 2 3

协程和多线程的优势?为什么有了多线程还要引入协程?

  • 极高的执行效率:
    • 因为函数(子程序)不是线程切换,而是由程序自身控制的,因此没有线程切换的开销;
    • 和多线程比,线程数量越多,协程的性能优势越明显
  • 不需要多线程的锁机制:
    • 因为只有一个线程,不存在同时写变量的冲突,在协程中控制共享资源不加锁,只需要判断状态就行了,因此执行效率比多线程高很多。

总结

这篇文章通过对比的方式,让大家更好地理解进程、线程、协程间的区别和联系。

希望对大家有帮助。

0 人点赞