(process)和(thread)是操作系统的基本概念,但是它们比较抽象,不容易掌握。
最近,我读到一篇,发现有一个很好的类比,可以把它们解释地清晰易懂。
1.计算机的核心是CPU,它承担了所有的计算任务。它就像一座工厂,时刻在运行。
2.假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。
3.进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。
4.一个车间里,可以有很多工人。他们协同完成一个任务。
5.线程就好比车间里的工人。一个进程可以包括多个线程。
6.车间的空间是工人们共享的,比如许多房间是每个工人都可以进出的。这象征一个进程的内存空间是共享的,每个线程都可以使用这些共享内存。
7.可是,每间房间的大小不同,有些房间最多只能容纳一个人,比如厕所。里面有人的时候,其他人就不能进去了。这代表一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。
8.一个防止他人进入的简单方法,就是门口加一把锁。先到的人锁上门,后到的人看到上锁,就在门口排队,等锁打开再进去。这就叫(Mutual exclusion,缩写 Mutex),防止多个线程同时读写某一块内存区域。
9.还有些房间,可以同时容纳n个人,比如厨房。也就是说,如果人数大于n,多出来的人只能在外面等着。这好比某些内存区域,只能供给固定数目的线程使用。
10.这时的解决方法,就是在门口挂n把钥匙。进去的人就取一把钥匙,出来时再把钥匙挂回原处。后到的人发现钥匙架空了,就知道必须在门口排队等着了。这种做法叫做(Semaphore),用来保证多个线程不会互相冲突。
11.不难看出,mutex是semaphore的一种特殊情况(n=1时)。也就是说,完全可以用后者替代前者。但是,因为mutex较为简单,且效率高,所以在必须保证资源独占的情况下,还是采用这种设计。
操作系统的设计,因此可以归结为三点:
- 以多进程形式,允许多个任务同时运行;
- 以多线程形式,允许单个任务分成不同的部分运行;
- 提供协调机制,一方面防止进程之间和线程之间产生冲突,另一方面允许进程之间和线程之间共享资源。
(完)
讨论:
- herodot 说:
你这篇关于进程和线程的文章,图文并茂,很通俗,但不易懂。坦白说,在我看来很多比喻很不恰当,比如:
1. 车间/电力/人三者,来比喻进程/CPU/线程三者,其实既没有体现出进程作为程序的一次执行(有独立的内存空间)这一特点,也没有体现出线程作为CPU 调度单位这一特点。人和电力的关系是什么呢?所以“车间的空间是工人们共享的,比如许多房间是每个工人都可以进出的”,这句话就很难理解。 2. 用厕所容量,来比喻锁,也不合适。因为线程间同步是为了防止竞争(就是说因同时修改,而导致的数据不一致)。本质上讲,进程的内存空间是天然独立的,线程的内存空间是天然共享的。正因为如此,进程通信/线程同步才是系统编程的很大一块内容。进程和线程简单而基本靠谱的定义如下:
1. 进程:程序的一次执行 2. 线程:CPU的基本调度单位 这两个概念虽然过于简单,但是完全可以为理解OS/线程/进程打下坚实的基础,我认为关于进程/线程的探讨,无论采用何种方式,都必须以这两句话为落脚点,才算靠谱。你写的大多数文章相当出色。在以通俗的方式解释复杂的概念这方面,尤其出色。但是,我个人的经验,这种方式比较适合用来解释一个复杂概念的一个方 面,或者从某个角度的理解。想面面俱到的说明白一个复杂的系统,繁琐枯燥的概念,以及这些概念间的推演几乎不可避免。坦白说,在实际项目中大量用到线程/ 进程之前,我看过很多遍相关的概念,也写过小的示例程序,但真到了用的时候,还是发现之前没搞明白。
我对进程/线程的理解也很粗浅。个人见解,仅供参考。
- GameXG 说:
>>假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。
>>进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。
>>一个车间里,可以有很多工人。他们协同完成一个任务。
>>线程就好比车间里的工人。一个进程可以包括多个线程。
文章的意思是同一个进程的多个线程是同时执行的,cpu的调度单位是进程。但实际是错误的,cpu的调度单位是线程,一次只能执行一个线程(当然多核的有几核就能同时执行几个线程),而不是一次执行一个进程!- viho_he 说:
抛开各种技术细节,从应用程序角度讲:
1、在单核计算机里,有一个资源是无法被多个程序并行使用的:cpu。
没有操作系统的情况下,一个程序一直独占着全都cpu。
如果要有两个任务来共享同一个CPU,程序员就需要仔细地为程序安排好运行计划--某时刻cpu和由程序A来独享,下一时刻cpu由程序B来独享
而这种安排计划后来成为OS的核心组件,被单独名命为“scheduler”,即“调度器”,它关心的只是怎样把单个cpu的运行拆分成一段一段的“运行片”,轮流分给不同的程序去使用,而在宏观上,因为分配切换的速度极快,就制造出多程序并行在一个cpu上的假象。
2、在单核计算机里,有一个资源可以被多个程序共用,然而会引出麻烦:内存。
在一个只有调度器,没有内存管理组件的操作系统上,程序员需要手工为每个程序安排运行的空间 -- 程序A使用物理地址0x00-0xff,程序B使用物理地址0x100-0x1ff,等等。
然而这样做有个很大的问题:每个程序都要协调商量好怎样使用同一个内存上的不同空间,软件系统和硬件系统千差万别,使这种定制的方案没有可行性。
为了解决这个麻烦,计算机系统引入了“虚拟地址”的概念,从三方面入手来做:2.1、硬件上,CPU增加了一个专门的模块叫MMU,负责转换虚拟地址和物理地址。
2.2、操作系统上,操作系统增加了另一个核心组件:memory management,即内存管理模块,它管理物理内存、虚拟内存相关的一系列事务。 2.3、应用程序上,发明了一个叫做【进程】的模型,(注意)每个进程都用【完全一样的】虚拟地址空间,然而经由操作系统和硬件MMU协作,映射到不同的物理地址空间上。不同的【进程】,都有各自独立的物理内存空间,不用一些特殊手段,是无法访问别的进程的物理内存的。3、现在,不同的应用程序,可以不关心底层的物理内存分配,也不关心CPU的协调共享了。然而还有一个问题存在:有一些程序,想要共享CPU,【并 且还要共享同样的物理内存】,这时候,一个叫【线程】的模型就出现了,它们被包裹在进程里面,在调度器的管理下共享CPu,拥有同样的虚拟地址空间,同时 也共享同一个物理地址空间,然而,它们无法越过包裹自己的进程,去访问别一个进程的物理地址空间。
4、进程之间怎样共享同一个物理地址空间呢?不同的系统方法各异,符合posix规范的操作系统都提供了一个接口,叫mmap,可以把一个物理地址空间映射到不同的进程中,由不同的进程来共享。
5、PS:在有的操作系统里,进程不是调度单位(即不能被调度器使用),线程是最基本的调度单位,调度器只调度线程,不调度进程,比如VxWorks- 阮一峰 说:
引用herodot的发言:你这篇关于进程和线程的文章,图文并茂,很通俗,但不易懂。坦白说,在我看来很多比喻很不恰当
进程和线程简单而基本靠谱的定义如下:
1. 进程:程序的一次执行 2. 线程:CPU的基本调度单位
我完全同意你对进程和线程的定义。
这篇文章的比喻,确实不是完全准确。但是,进程和线程要找到现实生活中准确的对应,恐怕很困难吧。
我的基本想法是:
(1)进程是一个容器。
(2)线程是容器中的工作单位。
车间—工人的比喻就是这样来的。
- herodot 说:
引用阮一峰的发言:我完全同意你对进程和线程的定义。
这篇文章的比喻,确实不是完全准确。但是,进程和线程要找到现实生活中准确的对应,恐怕很困难吧。
我的基本想法是:
(1)进程是一个容器。
(2)线程是容器中的工作单位。
车间—工人的比喻就是这样来的。
确实,对于一个复杂点的系统来说,在现实中找到完全对位的例子很难。这也是我前面回复中提到的,类比这种表达方式,贵在准而不在全。用一个生活中的例子,捕获到复杂系统一个侧面,就足够了。想完全对位,取舍之后,往往会很牵强,失去通俗易懂的目的。
我大概浏览了一下你所参考的原文(原文很长,我英文一般,可能理解的不完整),发现原文重点讲述了三个方面:
1. 进程与线程的关系 2. 线程间的关系 3. 线程与CPU (核心)的关系 而且只有1和2是用类比(多人合租房子,房子比做进程,人比做线程)来讲解的,这种比喻可以说很恰当,把进程和线程间的关系,以及线程间的关系分析的非常 清楚。而讲到3的时候,已经更多的从概念角度分析了,就是说在作者并没有试图在一个类比中说明这三个概念(我没有在那篇文章中找到电力概念)。而阮兄的文章,通过 工厂/车间/人 试图把CPU/进程/线程说清楚,这也是我的困惑所在。
在我看了,引入电力这种类比之后,但是开头这句,已经把线程/进程混淆了(不过话说回来,在linux系统里面,在最底层,进程线程确实不分的):假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。
- viho_he 说:
就我所知道到的OS(windows / linux / VxWorks / qnx)里,目前没有哪个是这样做的。引用小涛的发言:进程是OS在程序运行时资源分配和调度的一个独立单元,一个进程可以开启一个或多个线程,进程抢到cpu时间片之后,如果该进程开启了多个线程,再由线程抢占cpu时间片,谁得到时间片谁执行。
虽然目前没有不排除有这系统会这样去实现,然而从模型来说,这是个很糟糕的模型,因为这个模型增加了调度器的复杂度,调度器需要判断当前调度的单位 是进程还是线程,并且做出不同的处理,加上优先级、时间片轮转、线程/进程运行状态等机制以后,此模型复杂度会显著增加,而到了SMP(同构并发多处理 器)的系统上,此模型基本上已无能够工作的可能性。
即使在qnx这样鼓励用进程而非线程的微内核的OS上,文档仍然说到:Threads are scheduled globally across all processes.即调度的基本单位是线程,不是进程。调度器在调度任务时,只知道线程,不知道进程这个东西,对于进程的管理,是OS别的组件的事情。
- viho_he 说:
操作系统是一门实践性极强的学问,而且与CPU的硬件功能结合得非常紧密,可以说操作系统的核心模块都是关于怎样玩转CPU的硬件功能的,很多过去原本是 操作系统的软件功能,被做到了CPU硬件里面。个人经验是,不要怕接触技术细节,只有在大量具体的技术细节的积累之上,才能真正理解抽像的概念。 我建议你调试linux kernel玩玩,有条件的话买一个arm的开发板自己弄弄,没条件可以在PC机上安装模拟器来玩,比如QEMU。 读书的话,可以啃《Linux内核源代码情景分析》,不用读全书,只把你关心的那几章通读就行了。 另外,为了能真正读懂kernel源码,你需要至少学习一门CPU的知识(即阅读枯燥冗长的CPU手册)作为辅助,可以从IA入手,也可以从ARM入手, 以你手头的能用的硬件为准。最起码要了解中断的处理机制、内存的处理机制。 《Linux内核源代码情景分析》用的是IA。引用gordon的发言:viho_he 能够推荐一些资料吗?受个人条件限制,能把硬件和操作系统结合起来讲的人很少,遇到一个明白人不容易,就厚着脸皮问了。