标签:先来 user 控制流 单线程 dfa block 长度 discard 可见
java的多线程
java的多线程的概念,向来都是很复杂、笼统、抽象的。现实世界只有将知识点抽象过后才能有效的传播,但是传播的过程中,只有将抽象的知识点具象化,我们才能习得。所以我们会将个别内容点进行一个具象化进而解剖。当我们理解完了之后最终将其抽象成一个个名词:多线程、资源、锁等。
本文仅从以下的范围内容来谈谈java的多线程。
1. 何为线程,线程的作用
2. 资源的控制,锁的介绍
3. 线程池的作用
4. 多线程的常用工具和方法
1.何为线程
官方解释:线程是一个单一的顺序控制流程。
线程分主线程、子线程。由主线程来创建子线程来执行各种任务。
举例说明:以动漫“火影忍者”举例说明,主线程就好比每一个忍者,他们构成了最基本的忍者世界,一个忍者可以按照任务的缓急、难易程度同时执行多个任务。同时忍者也能分身(调用自身查克拉)来分担自身的任务,这就好比,忍者世界观中的忍者主体,基本等同于程序中的主线程。主线程没了,分身则主观上不可控,就消失了。
由上图可见,主线程与子线程的关系和忍者与分身的是很相似,也就是说,主线程能做的事,我们都能让子线程帮我们做。忍者自己能做的事也能去靠分身去做。接下来,我们来看两段代码。
代码一和代码二最终的结果都是只做了一件事,向控制台输出“Hello World!”。但是代码一是由主线程去做的;代码二是由主线程创建的子线程去做的。这里我们可以看出,主线程和子线程的本质上区分并不大,因为它们都执行相同的逻辑,这一点上并没有进行区分。
程序如果都是按照单个线程的话,那么所有任务的执行均是按照顺序来进行(串行执行)。
而多线程的作用是可以安排不同的线程执行不同的任务。
上图是一个理论值,我们在某些任务密集的场景下,多线程的执行效率多数情况下可能高于单线程的执行。
为什么说是可能,因为这里创建子线程是会消耗性能的,也带有时间消耗,如果设置不合理,单单创建子线程的时间成本就远大于执行任务的时间成本,这一点要结合实际场景进行考虑。
举例说明:火影里的忍者也不会接到一批任务就马上分身去一个个的做,他们也得结合任务的实际情况来考虑使用分身。
1. 线程可以执行正确的逻辑代码
2. 线程的创建也伴随着性能消耗,并不是无消耗
2.资源的控制
java中的资源可以理解为,一个实例或基础数据类型的变量的任何操作。实例或变量在这里不能完全算做资源,因为根据面向对象编程中的封装性,代码中直接将实例暴露出来给非本类的实例进行操作是一个大忌。
这里我们从以下资源和线程的关系进行解剖。
1. 一个线程可以执行多个资源(串行)
2. 多个线程可以执行多个资源(并行)
3. 单个资源可以被一个线程执行(串线)
4. 单个资源可以被多个线程执行(并行)
从这里看,1和3没什么问题。因为这种机制下我们确保了一个资源被一个线程执行(等同于一个任务被一个忍者(本体或分身均可)执行)。但是2和4就出现了一个现象,同一个资源被多个线程所操作,如果不加以控制,则会出现指定之外的执行结果或者直接产生死锁。
举例说明:两个忍者都执行了同一个任务,去杀死邻国的头目,我们假设忍者A过去杀死了头目,忍者B后去的,发现头目死了,那他接下来怎么办?算任务失败还是算完成了?
当然忍者B最后肯定还是回去复命了,也算他任务成功,这是任务本身的规则和秩序所决定的,但是程序的世界是无秩序,需要程序员通过代码去打造这个无序的世界从而形成秩序。
资源自身一定要包含约束性和规则性才能被正确的使用。
java本身提供了资源被多个线程调度的控制方式。
·synchronized关键字
·Atomic包
·ReentrantLock
·Semaphore
·CountDownLatch
·CyclicBarrier
·Phaser
我们通过一张图表来概况了解一下。
对于资源的控制的方式无非就是一个“锁” 字。现实当中到处充斥着这样的例子,例如一个城市的市长,按照规定只能有一个,谁上任,那么市长这个资源位就被谁“锁”住了。但是程序世界中的“锁”和现实世界中的“锁”差别很大。
·现实世界的锁,是可见,它控制着某一样可见的物体,比如:门、箱子等,而再由这些具有隔绝性质的物体去控制级别更高的资源,例如:门里的东西、箱子里的钱。也就是说现实世界的锁是间接的控制资源。
·程序世界里的锁,则是一种更为高级的抽象,它包含的对资源的各种维度的控制,我们可以将其理解为“规则”,比如:某类资源在同一时刻只能有一个线程进行操作(同步性)、某类资源必须由多个线程同时操作(同步协作)、某类资源最多只能有N个线程进行操作(资源调度许可证)。这些都是“规则”的运用。
java中有关于锁的内容非常多,我们这里先用一张图来简要介绍一下,以后再着重篇幅去介绍每个锁的相关特性。
1. 任何实例对外提供的方法(尽量避免对变量的直接操作)
2. 我们需要在对外提供的方法内用“锁”去控制方法内的被调度的规则。
3. 实行第二条之前一定要确定当前的编程环境,是单线程的还是多线程
3.线程池
用一段话形容线程和资源的关系那就是。某个人(
)去做(
)某件有要求和规则(
)的事(
);根据这件事(
)的要求和规则(
)去约束做这个事人(
)的做法。
我们用各种锁策略去保证资源能被正确的使用。这里我们还缺一个角度,那就是从线程的角度去调度资源。
我们用一个问题开头来展开对话。
·问:我们能根据资源的数量去创建线程的数量吗?
·答:不能,因为创建线程的开销大,受机器的配置的限制。
·问:那么能不能创建一定数量的线程,去循环的调度资源。
·答:这么做是可以的,但是资源数一般来说肯定是多于线程数,我们要控制资源的调度顺序,还未来得及调度的资源可以按先来后到原则存放到队列。
·问:那资源数少于线程数时候,该怎么样去处理。
·答:我们可以保留一定量的线程,为未来可能调度的资源做预备。
这就是一个线程池的雏形,线程池的雏形具有以下的基本特性
1. 具有最大的线程数限制
2. 有若干常备线程(核心线程)
3. 资源数若多超过了最大线程数的限制则会放入队列中。
我们来解刨线程池的最全的配置信息:
1. corePoolSize:核心线程数
2. maximumPoolSize:最大的线程数
3. keepAliveTime:无资源调度的线程回收的时间(默认单位:毫秒)
4. TimeUnit:时间单位
5. BlockingQueueRunnable:多余的资源放入的队列
6. ThreadFactory:线程的工厂类
7. RejectedExecutionHandler:线程池调度资源的策略
按照我们常规的设置
BlockingQueue maximumPoolSize ≥ corePoolSize
·corePoolSize会随着资源调度数增加至maximumPoolSize
·当线程空闲时,会根据keepAliveTime来回收线程数(maximumPoolSize-corePoolSize)
·BlockingQueue分无界Queue和有界Queue。
·当资源调度大于maximumPoolSize时会放入BlockingQueue中
o 当BlockingQueue是有界队列则存入
o 当BlockingQueue是无界队列则根据策略调整
·当资源调度数大于BlockingQueue的长度,则根据RejectedExecutionHandler的策略来调整资源调度情况。
o AbortPolicy:默认策略,舍弃最新的资源调度,并抛出异常
o DiscardPolicy:舍弃最新的资源调度,不会有异常
o DiscardOldestPolicy:舍弃在队列中队头的资源
o CallerRunsPolicy:交由主线程去执行(慎用)
o 自定义拒绝策略:实现RejectedExecutionHandler接口,编写特殊业务的拒绝策略。
总结:线程池就是多个线程来调度多个资源时所优化的一种多维度的策略,它的核心就是线程的复用以及资源的缓冲存储。
?
标签:先来 user 控制流 单线程 dfa block 长度 discard 可见
原文地址:https://www.cnblogs.com/qfdsj/p/9524232.html