一.如果只是简单地解决在多线程中对共享资源的读写并发问题,只需要用C++以下内容: 线程类 thread, 原子数据类模板 atomic<T> t, 互斥 mutex, 锁 lock, 条件变量 condition_variables.
二.在此基础上,如果想在并行编程中或者更好的性能,尤其当使用的是一些弱内存顺序的平台(比如PowerPC)的话,设定原子操作间的内存顺序则很有必要.
C++11 加入了支持并行编程的原子操作模块,而所有的原子操作都有一个参数 memory_order.
1.内存模型 简介
内存模型是一个硬件上的概念,表示机器指令是以什么样的顺序被处理器执行的 (现代的处理器不是逐条处理机器指令的) .
1 #include <thread> 2 #include <atomic> 3 4 atomic<int> a; 5 atomic<int> b; 6 void threadHandle() 7 { 8 int t = 1; 9 a = t; 10 b = 2; 11 }
在上面的线程处理函数中的三行代码,在寄存器中实际执行顺序可能与代码写的顺序不一致.在不同的机器平台下,处理器有可能对指令周期的执行顺序优化(一个时钟周期发射多条指令),就是说它可能让 b 的赋值语句比 a 的赋值语句先执行.
此时,如果有一个线程在循环地打印 a 和 b 的值,那么结果并不总是 a == 1 和 b == 2.
2.如何保证指令执行顺序
强顺序的内存模型指: 代码顺序和寄存器实际执行的顺序一致
弱顺序的内存模型指: 寄存器实际执行的顺序与代码顺序不一致,被处理器调整过
3.C++ 并行编程: 指定指令执行顺序
typedef enum memory_order { memory_order_relaxed, // 不对执行顺序做保证 memory_order_acquire, // 本线程中,所有后续的读操作必须在本条原子操作完成后执行 memory_order_release, // 本线程中,所有之前的写操作完成后才能执行本条原子操作 memory_order_acq_rel, // 同时包含 memory_order_acquire 和 memory_order_release memory_order_consume, // 本线程中,所有后续的有关本原子类型的操作,必须在本条原子操作完成之后执行 memory_order_seq_cst // 全部存取都按顺序执行 } memory_order;
测试: 下面的代码可能会打印出 a == 0; b == 2 这样的结果
1 #include <iostream> 2 #include <thread> 3 #include <atomic> 4 5 atomic<int> a{ 0 }; 6 atomic<int> b{ 0 }; 7 void SetValue() 8 { 9 int t = 1; 10 a.store(t, memory_order_relaxed); 11 b.store(2, memory_order_relaxed); 12 } 13 void Observer() 14 { 15 cout << a << b << endl; 16 } 17 18 int main() 19 { 20 thread T1(SetValue,0); 21 thread T2(Observer, 0); 22 23 T1.join(); 24 T2.join(); 25 26 return 0; 27 }
三.对于并行编程来说,可能最根本的还是如何将大量的计算问题按照需求分解成多个独立的,且能够同时运行的部分,并找出真正需要在线程间共享的数据,最后用原子操作实现.