标签:
之前自己在写一个爬虫项目的时候,用到了多线程的内容;但只是调用了java和python的线程池的库函数,而且没有涉及到多线程的核心内容(最起码连互斥都没有用到)。面试时被问到了相关的内容,回答的不太好,也提醒了自己把这块内容捡起来并夯实一下。
学习的原则是从最简单的可以run的demo开始。
主要参考了下面这个视频内容(https://www.youtube.com/watch?v=fcHngVr4y7M)需FQ。
代码如下:
#include <iostream> #include <unistd.h> #include <pthread.h> using namespace std; int sum = 0; void *add(void *); pthread_mutex_t mut; int main() { pthread_t thread[10]; int num; long count; cout << "Enter the number of thread bewteen (1-10): "; cin >> num; cout << "Enter number to count to: "; cin >> count; pthread_mutex_init(&mut, NULL); for ( int x=0; x <num; ++x ) pthread_create(&thread[x], NULL, add, (void *)count); for ( int x=0; x <num; ++x ) pthread_join(thread[x],NULL); cout << sum << endl; return 0; } void *add(void *count) { long num; num = (long) count; pthread_mutex_lock(&mut); for ( long x=1; x<=num; ++x ) { sum += x; cout << sum << ‘\t‘ << x << endl; } pthread_mutex_unlock(&mut); }
代码的功能很简单:
a. 有个一全局变量num用于累加的,每个线程都可以访问这个num
b. 向每个线程传入参数count,意义是每个线程内部对num累加多少
刚开始学习,不用纠结细节,先熟悉全貌。我总结需要大概了解以下几块内容,理解到哪算哪,有不到位的后面再改:
1)<pthread.h>
含义是“Linux系统下多线程遵循POSIX接口标准”(如果是windows的话,又有另一套接口标准了)
2)pthread_create(p1, p2, p3, p4) (参照:http://man7.org/linux/man-pages/man3/pthread_create.3.html)
函数原型:int pthread_create( pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg)
这是创建一个线程的函数。p2先不去管它,先看p1,p3和p4。
p1:指向标示线程id号变量的指针(如果线程创建成功,p1指向的元素中就会被赋值一个该线程的唯一标示值)
p3:指向线程执行的函数指针
p4:指向传给线程参数的指针
如果返回0:
a. 一个新线程就run起来了
b. 从“pthread_t *thread”指向的变量中,我们可以获得该线程的id号
c. 甚至有可能在pthread_create返回0之前,这个新线程就执行完毕了
3)pthread_join(p1, p2) (https://computing.llnl.gov/tutorials/pthreads/man/pthread_join.txt)
函数原型:int pthread_join(pthread_t thread, void **value_ptr)
功能是wait for thread termination,在代码中的目的是让主进程等待线程执行完毕再退出
p1:要wait的thread是谁(即线程创建时产生的唯一标示id)
p2:暂时还没用到
到这里,其实多线程的最简单的demo就可以跑起来了。但是这里会有问题:如果若干个线程同时对全局变量num操作,就会产生资源竞争的问题。
这时候就需要一种机制来避免这样的问题,其中一种机制就成为互斥量 mutex
用法:
1)先初始化互斥量pthread_mutex_init
2)在线程内部需要加锁的代码段前pthread_mutex_lock加锁
3)在资源使用结束后pthread_mutex_unlock解锁
关于mutex是啥,下面这段话解释的很好,直接粘过来了:
“
”
放到这个demo中来说,mut是一个互斥量,每个线程都可以访问,但是同时只能有一个线程对其成功lock;且一旦lock上了,其他线程就不能再lock或unlock了,只能由这个线程自身unlock。
这样,保证同时只有一个线程在操作num的值,因此这个demo中就线程同步了。
同步后的输出结果:
未用mutex同步时输入的结果:
对比以上的结果:没有加入mutex每次输出的结果可能是不同的;加了mutex的代码,每次输出的结果是稳定的。
上面的demo中有很多地方还不够完善,但是初步作为一个多线程共享资源的感性认识也差不多了。后续再逐渐深入。
标签:
原文地址:http://www.cnblogs.com/xbf9xbf/p/4699260.html