造成开销的操作包含:
1. 线程之间的协调(比如:锁、触发信号以及内存同步等)
2. 添加?的上下文切换
3. 线程的创建和销毁
4. 线程的调度
一、对性能的思考
1 性能与可伸缩性
执行速度涉及下面两个指标:
某个指定的任务单元须要“多快”才干处理完毕、计算资源一定的情况下,能完毕“多少”工作。
可伸缩性:
当添加?计算资源时(比如:CPU、内存、存储容器或I/O带宽),程序的吞吐量或者处理能力能对应地添加?。
2 评估各种性能权衡因素
避免不成熟的优化。首先使程序正确,然后再提高执行速度---假设它还执行得不够快。
以測试为基准,不要推測。
提出问题:比如“更快”的含义是什么?提升多少效率?
二、并发三大定律
Amdahl 定律
Gene Amdahl 发如今计算机体系架构设计过程中,某个部件的优化对整个架构的优化和改善是有上限的。这个发现后来成为知名的 Amdahl 定律。
(即使你有10个老婆,也不能一个月把孩子生下来。)
Gustafson 定律
Gustafson如果随着处理器个数的添加?,并行与串行的计算总量也是能够添加?的。Gustafson定律觉得加速系数差点儿跟处理器个数成正比,如果现实情况符合Gustafson定律的如果前提的话,那么软件的性能将能够随着处理个数的添加?而添加?。
(当你有10个老婆,就会要生很多其它的孩子。)
Sun-Ni 定律
充分利用存储空间等计算资源,尽量增大问题规模以产生更好/更精确的解。
(你要设法让每一个老婆都在干活,别让她们闲着。 )
1 演示样例:在各种框架中隐藏的串行部分
2 Amdahl定律的应用
多线程中串行部分是性能提升的瓶颈,比如:
多线程在同一个队列中取出任务,由于须要保证线程安全肯定在队列上加锁,此时就是多线程中串行部分。
多线程一般是处理一些计算,而计算结果可能须要多个线程间进行共享,这也是多线程中串行部分。
三、线程引入的开销
1 上下文切换
大多数通用的处理器中,上下文切换的开销相当于5000~10000个时钟周期(几微妙)
UNIX系统的vmstat、mpstat命令和Windows系统的perfmon工具都能报告上下文切换次数以及和内核中运行时间所占比例等信息。
2 内存同步
在 synchronized 和 volatile 提供的可见性保证中可能会使用一些特殊指令,即内存栅栏(Memory Barrier)。
public String getStoogeNames(){
Vector<String> stooges = new Vector<String>();
stooges.add( "Moe" );
stooges.add( "Larry" );
stooges.add( "Curly" );
return stooges.toString();
}
在运行getStoogeNames中,至少将Vector上的锁获取/释放4此,3次add操作与1次toString操作。
JVM会把在一起操作进行合并,可能仅须要获取1次add锁与1次toString锁。
3 堵塞
四、降低锁的竞争
在并发程序中,对可伸缩性的最主要威胁就是独占方式的资源锁。
有3中方式能够减少锁的竞争程度:
1. 降低锁的持有时间。
2. 减少锁的请求频率。
3. 使用带有协调机制的独占锁,这些机制同意更高的并发性。
1 缩小锁的范围(“快进快出”)
假设一个方法中,仅有一个变量是须要多线程间共享的,不须要在方法上加入?synchronized,由于这样会直接锁住整个方法导致其多线程间穿行运行,能够通过方法中仅锁住对共享变量操作的部分来缩小锁的范围提高性能。
2 减小锁的粒度(锁分解)
在一个分装中,假设分别提供的多个方法是分别对多个数据源操作,最严谨的方式是在全部方法上都把当前类作为锁定条件,可是能够通过在每一个数据源上加入?一个独立的锁。
3 锁分段
上一个中是一个类中涉及到多个数据源,假设仅有一个数据源(比如:Map)怎样提高性能?
在数据源上加入?分段锁,比如把map的个数除以4,4份中每一份是用一个单独的锁来锁定。
4 避免热点域
前面提到的一般是针对一个变量、一个数据集合、多个数据集合提高性能的办法,可是有些情况下一个方法内涉及到多个变量或者同一个变量的多个操作,能够通过降低这样的情况出现的次数提升性能。
5 一些替代独占锁的方法
通过放弃独占锁来提升性能。如并发容器,ReadWriteLock,不可变对象以及原子变量。
6 监測CPU的利用率
CPU没有得到充分利用的原因:
. 负载不充足
. I/O密集
. 外部限制
. 锁竞争
7 向对象池说“不”
对象分配操作的开销比同步的开销更低。
五、演示样例:比較Map的性能
六、降低上下文切换的开销
參考资料:
并发三大定律 摘录自《温绍锦 - Java并发程序设计教程》