码迷,mamicode.com
首页 > 编程语言 > 详细

进程线程相关

时间:2018-04-10 19:40:29      阅读:225      评论:0      收藏:0      [点我收藏+]

标签:限制   阻塞   数据结构   命令   编写   争夺   情况下   多进程   互斥量   

1.1什么是进程?

狭义定义:进程就是一段程序的执行过程。

广义定义:进程是一个具有一定独立功能的程序,关于某个数据集合的一次运行活动。它是操作系统动态执行 的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。

1.1.1 进城和程序的区别

程序:计算机指令的集合,它以文件的形式存储在磁盘上。程序是静态实体(passive Entity),在多道程序系统中,它是不能独立运行的,更不能与其他程序并发执行。

使用系统资源情况:不使用(程序不能申请系统资源,不能被系统调度,也不能作为独立运行的单位,它不占用系统的运行资源)。

进程:进程是程序实体(包括:程序段、相关的数据段、进程控制块PCB)的运行过程,是一个程序在其自身的地址空间中的一次执行活动。是系统进行资源分配和调度的一个独立单位。

(进程是资源申请、调度和独立运行的单位,因此,它使用系统中的运行资源)

1.2操作系统引入进程的概念的原因

? 从理论角度看,是对正在运行的程序过程的抽象;? 从实现角度看,是一种数据结构,目的在于清晰地刻画动态系统的内在规律,有效管理和调度进入计算机系统主存储器运行的程序。

1.3进程的特征

动态性:进程的实质是程序在多道程序系统中的一次执行过程,进程是动态产生,动态消亡的。

并发性:任何进程都可以同其他进程一起并发执行

独立性:进程是一个能独立运行的基本单位,同时也是系统分配资源和调度的独立单位;

异步性:由于进程间的相互制约,使进程具有执行的间断性,即进程按各自独立的、不可预知的速度向前推进

结构特征:进程由程序、数据和进程控制块三部分组成;

多个不同的进程可以包含相同的程序:一个程序在不同的数据集里就构成不同的进程,能得到不同的结果; 但是执行过程中,程序不能发生改变。

1.4进程状态

1.4.1 进程三(五)种基本状态

创建状态:进程在创建时需要申请一个空白PCB,向其中填写控制和管理进程的信息,完成资源分配,把此时进程所处状态称为创建状态

就绪状态:进程已获得除处理器外的所需资源,等待分配处理器资源;只要分配了处理器进程就可执行.就绪进程可以按多个优先级来划分队列。例如,当一个进程由于时间片用完而进入就绪状态时,排入低优先级队列;当进程由I/O操作完成而进入就绪状态时,排入高优先级队列。(三种之一)运行状态:进程占用处理器资源;处于此状态的进程的数目小于等于处理器的数目。在没有其他进程可以执行时(如所有进程都在阻塞状态),通常会自动执行系统的空闲进程。(三种之一)阻塞状态:由于进程等待某种条件(如I/O操作或进程同步),在条件满足之前无法继续执行。该事件发生前即使把处理机分配给该进程,也无法运行。(三种之一)

终止状态:进程结束,或出现错误,或被系统终止,进入终止状态。无法再执行

 

1.4.3 linux下进程状态 6种

在linux下,通过ps命令我们能够查看到系统中存在的进程,以及它们的状态:

R (TASK_RUNNING)

可执行状态.只有在该状态的进程才可能在CPU上运行。而同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。只要可执行队列不为空,其对应的CPU就不能偷懒,就要执行其中某个进程。一般称此时的CPU“忙碌”。对应的,CPU“空闲”就是指其对应的可执行队列为空,以致于CPU无事可做。很多操作系统教科书将正在CPU上执行的进程定义为RUNNING状态、而将可执行但是尚未被调度执行的进程定义为READY状态,这两种状态在linux下统一为 TASK_RUNNING状态。

S (TASK_INTERRUPTIBLE)

可中断的睡眠状态。处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。通过ps命令我们会看到,一般情况下,进程列表中的绝大多数进程都处于TASK_INTERRUPTIBLE状态(除非机器的负载很高)。毕竟CPU就这么一两个,进程动辄几十上百个,如果不是绝大多数进程都在睡眠,CPU又怎么响应得过来。

D (TASK_UNINTERRUPTIBLE)

不可中断的睡眠状态。显式被wakeup,否则一直是D状态。“UN” 只针对信号,调用wakeup()是可以的与TASK_INTERRUPTIBLE状态类似,进程处于睡眠状态,但是此刻进程是不可中断的。不可中断,指的并不是CPU不响应外部硬件的中断,而是指进程不响应异步信号绝大多数情况下,进程处在睡眠状态时,总是应该能够响应异步信号的。kill -9杀不死一个TASK_UNINTERRUPTIBLE进程了!而TASK_UNINTERRUPTIBLE状态存在的意义就在于,内核的某些处理流程是不能被打断的。如果响应异步信号,程序的执行流程中就会被插入一段用于处理异步信号的流程(这个插入的流程可能只存在于内核态,也可能延伸到用户态),于是原有的流程就被中断了(。在进程对某些硬件进行操作时(比如进程调用read系统调用对某个设备文件进行读操作,而read系统调用最终执行到对应设备驱动的代码,并与对应的物理设备进行交互),可能需要使用TASK_UNINTERRUPTIBLE状态对进程进行保护,以避免进程与设备交互的过程被打断,造成设备陷入不可控的状态。(比如read系统调用触发了一次磁盘到用户空间的内存的DMA,如果DMA进行过程中,进程由于响应信号而退出了,那么DMA正在访问的内存可能就要被释放了。)这种情况下的TASK_UNINTERRUPTIBLE状态总是非常短暂的,通过ps命令基本上不可能捕捉到linux系统中也存在容易捕捉的TASK_UNINTERRUPTIBLE状态。执行vfork系统调用后,父进程将进入TASK_UNINTERRUPTIBLE状态,直到子进程调用exit或exec.不管kill还是kill -9,这个TASK_UNINTERRUPTIBLE状态的父进程依然屹立不倒。

T (TASK_STOPPED or TASK_TRACED)

暂停状态或跟踪状态。向进程发送一个SIGSTOP信号,它就会因响应该信号而进入TASK_STOPPED状态(除非该进程本身处于TASK_UNINTERRUPTIBLE状态而不响应信号)。(SIGSTOP与SIGKILL信号一样,是非常强制的。不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数。)向进程发送一个SIGCONT信号,可以让其从TASK_STOPPED状态恢复到TASK_RUNNING状态。当进程正在被跟踪时,它处于TASK_TRACED这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行操作。比如在gdb中对被跟踪的进程下一个断点,进程在断点处停下来的时候就处于TASK_TRACED状态。而在其他时候,被跟踪的进程还是处于前面提到的那些状态。

对于进程本身来说,TASK_STOPPED和TASK_TRACED状态很类似,都是表示进程暂停下来。而TASK_TRACED状态相当于在TASK_STOPPED之上多了一层保护,处于TASK_TRACED状态的进程不能响应SIGCONT信号而被唤醒。只能等到调试进程通过ptrace系统调用执行PTRACE_CONT、PTRACE_DETACH等操作(通过ptrace系统调用的参数指定操作),或调试进程退出,被调试的进程才能恢复TASK_RUNNING状态。

Z (TASK_DEAD - EXIT_ZOMBIE)

退出状态,进程成为僵尸进程。进程在退出的过程中,处于TASK_DEAD状态。在这个退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。于是进程就只剩下task_struct这么个空壳,故称为僵尸。之所以保留task_struct,是因为task_struct里面保存了进程的退出码、以及一些统计信息。而其父进程很可能会关心这些信息。比如在shell中,$?变量就保存了最后一个退出的前台进程的退出码,而这个退出码往往被作为if语句的判断条件。父进程可以通过wait系列的系统调用(如wait4、waitid)来等待某个或某些子进程的退出,并获取它的退出信息。然后wait系列的系统调用会顺便将子进程的尸体(task_struct)也释放掉。子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。当进程退出的时候,会将它的所有子进程都托管给别的进程(使之成为别的进程的子进程)。可能是退出进程所在进程组的下一个进程(如果存在的话),或者是1号进程。所以每个进程、每时每刻都有父进程存在。除非它是1号进程。1号进程,pid为1的进程,又称init进程。linux系统启动后,第一个被创建的用户态进程就是init进程。它有两项使命:1、执行系统初始化脚本,创建一系列的进程(它们都是init进程的子孙);2、在一个死循环中等待其子进程的退出事件,并调用waitid系统调用来完成“收尸”工作;init进程不会被暂停、也不会被杀死(这是由内核来保证的)。它在等待子进程退出的过程中处于TASK_INTERRUPTIBLE状态,“收尸”过程中则处于TASK_RUNNING状态。

X (TASK_DEAD - EXIT_DEAD)

退出状态,进程即将被销毁。而进程在退出过程中也可能不会保留它的task_struct。比如这个进程是多线程程序中被detach过的线程,或者父进程通过设置SIGCHLD信号的handler为SIG_IGN,显式的忽略了SIGCHLD信号。(这是posix的规定,尽管子进程的退出信号可以被设置为SIGCHLD以外的其他信号。)此时,进程将被置于EXIT_DEAD退出状态,这意味着接下来的代码立即就会将该进程彻底释放。所以EXIT_DEAD状态是非常短暂的,几乎不可能通过ps命令捕捉到

技术分享图片

1.5进程和程序的区别

  1. 程序是指令和数据的有序集合,是一个静态的概念。而进程是程序在处理机上的一次执行过程,它是一个动态的概念。

  2. 程序可以作为一种软件资料长期存在,而进程是有一定生命期的。程序是永久的,进程是暂时的。

  3. 进程是由进程控制块、程序段、数据段三部分组成;

  4. 进程具有创建其他进程的功能,而程序没有。

  5. 同一程序同时运行于若干个数据集合上,它将属于若干个不同的进程,也就是说同一程序可以对应多个进程。

  6. 在传统的操作系统中,程序并不能独立运行,作为资源分配和独立运行的基本单元都是进程。

1.6 进程控制

进程控制是进程管理中最基本的功能。它用于创建一个新进程,终止一个已完成的进程,或者去终止一个因出现某事件而使其无法运行下去的进程,还可负责进程运行中的状态转换。

1.6.1 引起创建进程的事件

  1. 用户登录

    在分时系统中,用户在终端键入登录命令后,如果是合法用户,系统将为该终端建立一个进程,并把它插入到就绪队列中。

  2. 作业调度

    在批处理系统中,当作业调度程序按照一定的算法调度到某作业时,便将该作业装入到内存,为它分配必要的资源,并立即为它创建进程,再插入到就绪队列中。

  3. 提供服务

    当运行中的用户程序提出某种请求后,系统将专门创建一个进程来提供用户所需要的服务,例如,用户程序要求进行文件打印,操作系统将为它创建一个打印进程,这样,不仅可以使打印进程与该用户进程并发执行,而且还便于计算出为完成打印任务所花费的时间。

  4. 应用请求

    用户程序自己创建进程。进程派生。基于应用进程的需求,由它创建一个新的进程,以便使新进程以并发的运行方式完成特定任务

1.6.2 进程的创建过程

一旦操作系统发现了要求创建新进程的事件后,便调用进程创建原语creat()按下述步骤创建一个新进程。

  1. 申请空白PCB。为新进程申请获得唯一的数字标识符,并从PCB集合中索取一个空白PCB。

  2. 为新进程分配资源。

  3. 初始化进程控制块。PCB的初始化包括:

    1. 初始化标识信息,将系统分配的标识符和父进程标识符,填入新的PCB中。

    2. 初始化处理机状态信息,使程序计数器指向程序的入口地址,使栈指针指向栈顶。

    3. 初始化处理机控制信息,将进程的状态设置为就绪状态或静止就绪状态,对于优先级,通常是将它设置为最低优先级,除非用户以显式的方式提出高优先级要求。

  4. 将新进程插入就绪队列,如果进程就绪队列能够接纳新进程,便将新进程插入到就绪队列中。

1.6.3 进程终止

引起进程终止的事件

  1. 正常结束

  2. 异常结束

    超过时限,无可用内存,越界,保护错误,算数错误,IO失败,无效指令,特权指令,数据错误

  3. 外界干预

    父进程终止,父进程请求

    ?

1.6.4 进程的终止过程

如果系统发生了上述要求终止进程的某事件后,OS便调用进程终止原语,按下述过程去终止指定的进程。

  1. 根据被终止进程的标识符,从PCB集合中检索出该进程的PCB,从中读出该进程状态。

  2. 若被终止进程正处于执行状态,应立即终止该进程的执行,并置调度标志为真。用于指示该进程被终止后应重新进行调度。

  3. 若该进程还有子孙进程,还应将其所有子孙进程予以终止,以防他们成为不可控的进程。

  4. 将被终止的进程所拥有的全部资源,或者归还给其父进程,或者归还给系统。

  5. 将被终止进程(它的PCB)从所在队列(或链表)中移出,等待其它程序来搜集信息。

1.6.5 进入阻塞态原因

引起进程阻塞和唤醒的事件

  1. 请求系统服务

  2. 启动某种操作

  3. 新数据尚未到达

  4. 无新工作可做

1.6.6 进程阻塞过程和唤醒

阻塞:

正在执行的进程,当发现上述某事件后,由于无法继续执行,于是进程便通过调用阻塞原语block把自阻塞。可见,进程的阻塞是进程自身的一种主动行为。进入block过程后,由于此时该进程还处于执行状态,所以应先立即停止执行,把进程控制块中的现行状态由执行改为阻塞,并将PCB插入阻塞队列。如果系统中设置了因不同事件而阻塞的多个阻塞队列,则应将本进程插入到具有相同事件的阻塞(等待)队列。最后,转调度程序进行重新调度,将处理机分配给另一就绪进程,并进行切换,亦即,保留被阻塞进程的处理机状态(在PCB中),再按新进程的PCB中的处理机状态设置CPU环境。

唤醒:

当被阻塞的进程所期待的事件出现时,如I/O完成或者其所期待的数据已经到达,则由有关进程(比如,用完并释放了该I/O设备的进程)调用唤醒原语wakeup(),将等待该事件的进程唤醒。唤醒原语执行的过程是:首先把被阻塞的进程从等待该事件的阻塞队列中移出,将其PCB中的现行状态由阻塞改为就绪,然后再将该PCB插入到就绪队列中。

1.7 进程间通信方式

高级通信机制:

  1. 共享存储器系统(存储器中划分的共享存储区)

    实际操作中对应的是“剪贴板”(剪贴板实际上是系统维护管理的一块内存区域)的通信方式。

  2. 消息传递系统(进程间的数据交换以消息(message)为单位)

  当今最流行的微内核操作系统中,微内核与服务器之间的通信,都采用 了消息传递机制

  1. 管道通信系统(连接读写进程实现他们之间通信的共享文件(pipe文件,类似先进先出的队列,由一个进程写,另一进程读))

  2. socket

1.7.1 消息队列

解耦写入和处理的能力差异,避免写的太多处理不过来,一个个排队等着。将突发大量请求转换为后端能承受的队列请求。生产消费模式.

消息队列好处

  1. 异步化

  2. 解耦

  3. 消除峰值

消息队列使用的四种场景介绍

1.7.2 管道

普通管道PIPE 、流管道(s_pipe)、命名管道(name_pipe

  • 管道是一种半双工的通信方式,数据只能单项流动,并且只能在具有亲缘关系的进程间流动,进程的亲缘关系通常是父子进程

  • 命名管道也是半双工的通信方式,它允许无亲缘关系的进程间进行通信

管道: 优点是所有的UNIX实现都支持, 并且在最后一个访问管道的进程终止后,管道就被完全删除;缺陷是管道只允许单向传输或者用于父子进程之间.

系统IPC: 优点是功能强大,能在毫不相关进程之间进行通讯; 缺陷是关键字KEY_T使用了内核标识,占用了内核资源,而且只能被显式删除,而且不能使用SOCKET的一些机制,例如select,epoll等.

1.8 进程和作业

作业是用户需要计算机完成某项任务时要求计算机所做工作的集合。而进程则是已提交完毕程序的执行过程的描述,是资源分配的基本单位。主要区别:

  1. 作业是用户向计算机提交任务的任务实体。

  2. 一个作业可由多个进程组成。

  3. 作业的概念主要用于批处理系统中。

1.9 进程上下文

1.9.1 什么是进程上下文

进程上下文是一个抽象的概念,它包含了每个进程执行过的、执行时的以及待执行的指令和数据,在指令寄存器、堆栈(存放个调用子程序的返回点和参数等),状态字寄存器等中的内容。

  • 上文:已执行过的进程指令和数据在相关寄存器与堆栈中的内容。

  • 正文:正在执行的指令和数据在相关寄存器与堆栈中的内容。

  • 下文:待执行的指令和数据在相关寄存器与堆栈中的内容。

1.9.2 进程上下文切换

进程上下文切换发生在不同的进程之间而不是同一个进程内。包含3个部分,

  1. 保存被切换进程的正文部分(或当前状态)至有关存储区。

  2. 操作系统进程中有关调度和资源分配程序执行,并选取新的进程。

  3. 将被选中进程的原来被保存的正文部分从有关存储区中选出,并送至有关寄存器或堆栈中,激活被选中进程执行。

1.10 进程调度算法

1.10.1 先来先服务 (FCFS,first come first served)

在所有调度算法中,最简单的是非抢占式的FCFS算法。 算法原理:进程按照它们请求CPU的顺序使用CPU.就像你买东西去排队,谁第一个排,谁就先被执行,在它执行的过程中,不会中断它。当其他人也想进入内存被执行,就要排队等着,如果在执行过程中出现一些事,他现在不想排队了,下一个排队的就补上。此时如果他又想排队了,只能站到队尾去。 算法优点:易于理解且实现简单,只需要一个队列(FIFO),且相当公平 算法缺点:比较有利于长进程,而不利于短进程,有利于CPU 繁忙的进程,而不利于I/O 繁忙的进程

1.10.2 最短作业优先(SJF, Shortest Job First)

短作业优先(SJF, Shortest Job First)又称为“短进程优先”SPN(Shortest Process Next);这是对FCFS算法的改进,其目标是减少平均周转时间。 算法原理:对预计执行时间短的进程优先分派处理机。通常后来的短进程不抢先正在执行的进程。 算法优点:相比FCFS 算法,该算法可改善平均周转时间和平均带权周转时间,缩短进程的等待时间,提高系统的吞吐量。 算法缺点:对长进程非常不利,可能长时间得不到执行,且未能依据进程的紧迫程度来划分执行的优先级,以及难以准确估计进程的执行时间,从而影响调度性能。

1.10.3 最高响应比优先法(HRRN,Highest Response Ratio Next)

最高响应比优先法(HRRN,Highest Response Ratio Next)是对FCFS方式和SJF方式的一种综合平衡。FCFS方式只考虑每个作业的等待时间而未考虑执行时间的长短,而SJF方式只考虑执行时间而未考虑等待时间的长短。因此,这两种调度算法在某些极端情况下会带来某些不便。HRN调度策略同时考虑每个作业的等待时间长短和估计需要的执行时间长短,从中选出响应比最高的作业投入执行。这样,即使是长作业,随着它等待时间的增加,W / T也就随着增加,也就有机会获得调度执行。这种算法是介于FCFS和SJF之间的一种折中算法。 算法原理响应比R定义如下: R =(W+T)/T = 1+W/T 其中T为该作业估计需要的执行时间,W为作业在后备状态队列中的等待时间。每当要进行作业调度时,系统计算每个作业的响应比,选择其中R最大者投入执行。 算法优点:由于长作业也有机会投入运行,在同一时间内处理的作业数显然要少于SJF法,从而采用HRRN方式时其吞吐量将小于采用SJF 法时的吞吐量。 算法缺点:由于每次调度前要计算响应比,系统开销也要相应增加。

1.10.4 时间片轮转算法(RR,Round-Robin)

该算法采用剥夺策略。时间片轮转调度是一种最古老,最简单,最公平且使用最广的算法,又称RR调度。每个进程被分配一个时间段,称作它的时间片,即该进程允许运行的时间。 算法原理:让就绪进程以FCFS 的方式按时间片轮流使用CPU 的调度方式,即将系统中所有的就绪进程按照FCFS 原则,排成一个队列,每次调度时将CPU 分派给队首进程,让其执行一个时间片,时间片的长度从几个ms 到几百ms。在一个时间片结束时,发生时钟中断,调度程序据此暂停当前进程的执行,将其送到就绪队列的末尾,并通过上下文切换执行当前的队首进程,进程可以未使用完一个时间片,就出让CPU(如阻塞)。 算法优点:时间片轮转调度算法的特点是简单易行、平均响应时间短。 算法缺点:不利于处理紧急作业。在时间片轮转算法中,时间片的大小对系统性能的影响很大,因此时间片的大小应选择恰当 怎样确定时间片的大小:

时间片大小的确定 1.系统对响应时间的要求 2.就绪队列中进程的数目 3.系统的处理能力

1.10.5 多级反馈队列(Multilevel Feedback Queue)

多级反馈队列调度算法是一种CPU处理机调度算法,UNIX操作系统采取的便是这种调度算法。 多级反馈队列调度算法描述:   1、进程在进入待调度的队列等待时,首先进入优先级最高的Q1等待。   2、首先调度优先级高的队列中的进程。若高优先级中队列中已没有调度的进程,则调度次优先级队列中的进程。例如:Q1,Q2,Q3三个队列,只有在Q1中没有进程等待时才去调度Q2,同理,只有Q1,Q2都为空时才会去调度Q3。   3、对于同一个队列中的各个进程,按照时间片轮转法调度。比如Q1队列的时间片为N,那么Q1中的作业在经历了N个时间片后若还没有完成,则进入Q2队列等待,若Q2的时间片用完后作业还不能完成,一直进入下一级队列,直至完成。   4、在低优先级的队列中的进程在运行时,又有新到达的作业,那么在运行完这个时间片后,CPU马上分配给新到达的作业(抢占式)。   在多级反馈队列调度算法中,如果规定第一个队列的时间片略大于多数人机交互所需之处理时间时,便能够较好的满足各种类型用户的需要。

1.11 linux 线程调度策略

linux内核的三种调度方法:

  1. SCHED_OTHER 分时调度策略,

  2. SCHED_FIFO实时调度策略,先到先服务

  3. SCHED_RR实时调度策略,时间片轮转

实时进程将得到优先调用,实时进程根据实时优先级决定调度权值,分时进程则通过nice和counter值决定权值,nice越小,counter越大,被调度的概率越大,也就是曾经使用了cpu最少的进程将会得到优先调度。

SHCED_RR和SCHED_FIFO:

当采用SHCED_RR策略的进程的时间片用完,系统将重新分配时间片,并置于就绪队列尾。放在队列尾保证了所有具有相同优先级的RR任务的调度公平。

SCHED_FIFO一旦占用cpu则一直运行。一直运行直到有更高优先级任务到达或自己放弃。如果有相同优先级的实时进程(根据优先级计算的调度权值是一样的)已经准备好,FIFO时必须等待该进程主动放弃后才可以运行这个优先级相同的任务。而RR可以让每个任务都执行一段时间。

相同点:RR和FIFO都只用于实时任务。 创建时优先级大于0(1-99)。 按照可抢占优先级调度算法进行。就绪态的实时任务立即抢占非实时任务。

.12 进程其他东西

1.12.1 进程控制块PCB的作用

  1. 作为独立运行基本单位的标志

  2. 能实现间断性运行方式

  3. 提供进程通信管理所需要的信息

  4. 提供进程调度所需要的信息

2. 线程

2.1 什么是线程

进程是资源管理的最小单位,线程是程序执行的最小单位。在操作系统设计上,从进程演化出线程,最主要的目的就是更好的支持SMP以及减小(进程/线程)上下文切换开销。

核心级线程和用户级线程两种线程模型,分类的标准主要是线程的调度者在核内还是在核外。前者更利于并发使用多处理器的资源,而后者则更多考虑的是上下文切换开销

线程是进程的实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。

有了进程之后还要有线程的原因是

2.1.1 线程和进程间的区别

  • 进程是具有一定功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源调度和分配的一个独立单位。

  • 线程是进程的实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。

  • 一个进程可以有多个线程,多个线程也可以并发执行

2.1.2 线程优势

  1. 进程的换入换出、数据交换开销太大,线程远远小于进程的开销。首先,进程之间通信需要获取共享资源锁,而同一进程内的线程完全享有进程获得的资源,也因此线程的编写要特别注意同步问题。

  2. 进程的创建成本很高,涉及空间分配、初始化栈、初始化数据等,而线程的创建成本低很多可以包括操作系统创建和进程调用库自己创建。于是有了两种不同类型的线程——用户级别和内核级别。

  3. 多道程序设计中线程的换入换出比进程来得快多了,因为不需要保存进程控制块等一大堆数据(当然要保存线程控制块,但是成本很低)

  4. 销毁成本低。

2.1.3 多线程应用场景

  1. 用户界面和后台数据运行:用户界面渲染和后台数据运算使用不同的线程,没有喜欢后台一运算界面就卡死的程序吧。

  2. 异步计算:不如实时备份,一个线程定时触发就可以了,没必要进程定时的检查是不是该备份了。

  3. 速度敏感的计算:可以并发计算的、多核处理的,在计算和组织上线程更具优势。

  4. 模块化:模块化的程序有时候很适合用多线程来设计。

2.1.4 线程与进程的区别

主要差别在于它们是不同的操作系统资源管理方式。

进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。

线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮。

但在进程切换时,耗费资源较大,效率要差一些。

但对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。

 

2.2 线程模型

LinuxThreads和NPTL

用户级别的线程是进程调用线程库创建的,对操作系统是透明的,是进程中通过代码实现切换的因此因此一旦一个线程引起了I/O阻塞从操作系统的视角就是进程阻塞,所以要阻塞整个进程;

而内核级别的线程是操作系统创建的,所以该阻塞线程的不会阻塞整个进程,当然效率也就没有用户级别的高。

2.3 同步

2.3.1 同步方式

  • 互斥量:采用互斥对象机制,只有拥有互斥对象的线程才有访问公共资源的权限。因为互斥对象只有一个,所以可以保证公共资源不会被多个线程同时访问。

  • 信号量:它允许同一时刻多个线程访问同一资源,但是需要控制同一时刻访问此资源的最大线程数量

  • 条件变量:通过通知操作的方式来保持多线程同步,还可以方便的实现多线程优先级的比较操作。

  • 读写锁:

2.4 死锁

2.4.1 死锁是什么

在两个或者多个并发进程中,如果每个进程持有某种资源而又等待其它进程释放它或它们现在保持着的资源,在未改变这种状态之前都不能向前推进,称这一组进程产生了死锁。通俗的讲就是两个或多个进程无限期的阻塞、相互等待的一种状态。

应该改为函数,一个进程中的一个函数,和信号处理函数。

2.4.2 死锁产生的四个条件

有一个条件不成立,则不会产生死锁。

  • 互斥条件:一个资源一次只能被一个进程使用

  • 请求与保持条件:一个进程因请求资源而阻塞时,对已获得资源保持不放

  • 不剥夺条件:进程获得的资源,在未完全使用完之前,不能强行剥夺

  • 循环等待条件:若干进程之间形成一种头尾相接的环形等待资源关系

系统资源的竞争

通常系统中拥有的不可剥夺资源,其数量不足以满足多个进程运行的需要,使得进程在运行过程中,会因争夺资源而陷入僵局,如磁带机、打印机等。只有对不可剥夺资源的竞争 才可能产生死锁,对可剥夺资源的竞争是不会引起死锁的。

进程推进顺序非法

进程在运行过程中,请求和释放资源的顺序不当,也同样会导致死锁。例如,并发进程 P1、P2分别保持了资源R1、R2,而进程P1申请资源R2,进程P2申请资源R1时,两者都 会因为所需资源被占用而阻塞。

2.4.3 预防死锁

  1. 破坏“请求和保持”条件:规定所有进程在开始运行之前,都必须一次性的申请其在整个运行过程所需要的全部资源。优点:简单,安全。 缺点:资源严重浪费,恶化了系统的利用率;

  2. 破坏“不剥夺”条件:进程逐个的提出资源请求,当一个已经保持了某些资源的进程,再提出新的资源请求而不能立即得到满足时,必须释放它已经保持了的所有资源,待以后需要时再重新申请。

    缺点:实现复杂,代价大,反复地申请和释放资源,而使进程的执行无限的推迟、延长了进程的周转时间增加系统开销、降低系统吞吐量。

  3. 破坏“环路等待”条件:将所有的资源按类型进行线性排队,并赋予不同的序号。所有进程请求资源必须按照资源递增的次序提出,防止出现环路。

    缺点:1、序号必须相对稳定,限制了新设备类型的增加2、作业(进程)使用资源顺序和系统规定的顺序不同而造成资源的浪费3、限制了用户编程

由于互斥条件是非共享设备所必需的,不能改变

2.4.4 避免死锁

  1. 加锁顺序(线程按照一定的顺序加锁)

    当多个线程需要相同的一些锁,但是按照不同的顺序加锁,死锁就很容易发生。

  2. 加锁时限(线程尝试获取锁的时候加上一定的时限,超过时限则放弃对该锁的请求,并释放自己占有的锁)

    若一个线程没有在给定的时限内成功获得所有需要的锁,则会进行回退并释放所有已经获得的锁,然后等待一段随机的时间再重试。这段随机的等待时间让其它线程有机会尝试获取相同的这些锁,并且让该应用在没有获得锁的时候可以继续运

  3. 死锁检测

    每当一个线程获得了锁,会在线程和锁相关的数据结构中(map、graph等等)将其记下。除此之外,每当有线程请求锁,也需要记录在这个数据结构中。

    当一个线程请求锁失败时,这个线程可以遍历锁的关系图看看是否有死锁发生。例如,线程A请求锁7,但是锁7这个时候被线程B持有,这时线程A就可以检查一下线程B是否已经请求了线程A当前所持有的锁。如果线程B确实有这样的请求,那么就是发生了死锁(线程A拥有锁1,请求锁7;线程B拥有锁7,请求锁1)。

    当然,死锁一般要比两个线程互相持有对方的锁这种情况要复杂的多。线程A等待线程B,线程B等待线程C,线程C等待线程D,线程D又在等待线程A。线程A为了检测死锁,它需要递进地检测所有被B请求的锁。从线程B所请求的锁开始,线程A找到了线程C,然后又找到了线程D,发现线程D请求的锁被线程A自己持有着。这是它就知道发生了死锁。

    当检测出死锁时,这些线程该做些什么呢?

    一个可行的做法是释放所有锁,回退,并且等待一段随机的时间后重试。这个和简单的加锁超时类似,不一样的是只有死锁已经发生了才回退,而不会是因为加锁的请求超时了。虽然有回退和等待,但是如果有大量的线程竞争同一批锁,它们还是会重复地死锁(编者注:原因同超时类似,不能从根本上减轻竞争)。

    一个更好的方案是给这些线程设置优先级,让一个(或几个)线程回退,剩下的线程就像没发生死锁一样继续保持着它们需要的锁。如果赋予这些线程的优先级是固定不变的,同一批线程总是会拥有更高的优先级。为避免这个问题,可以在死锁发生的时候设置随机的优先级。

2.4.5 锁的分类

分为独占锁,互斥量等

共享锁和更新锁 ,主要是读写锁的,读锁和写锁

进程线程相关

标签:限制   阻塞   数据结构   命令   编写   争夺   情况下   多进程   互斥量   

原文地址:https://www.cnblogs.com/perfy576/p/8781536.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!