pthread中提供的锁有:pthread_mutex_t, pthread_spinlock_t, pthread_rwlock_t。
pthread_mutex_t是互斥锁,同一瞬间只能有一个线程能够获取锁,其他线程在等待获取锁的时候会进入休眠状态。因此pthread_mutex_t消耗的CPU资源很小,但是性能不高,因为会引起线程切换。
pthread_spinlock_t是自旋锁,同一瞬间也只能有一个线程能够获取锁,不同的是,其他线程在等待获取锁的过程中并不进入睡眠状态,而是在CPU上进入“自旋”等待。自旋锁的性能很高,但是只适合对很小的代码段加锁(或短期持有的锁),自旋锁对CPU的占用相对较高。
pthread_rwlock_t是读写锁,同时可以有多个线程获得读锁,同时只允许有一个线程获得写锁。其他线程在等待锁的时候同样会进入睡眠。读写锁在互斥锁的基础上,允许多个线程“读”,在某些场景下能提高性能。
诸如pthread中的pthread_cond_t, pthread_barrier_t, semaphone等,更像是一种同步原语,不属于单纯的锁。
TBB中提供的锁有:
mutex 互斥锁,等同于pthread中的互斥锁(实际上就是对pthread_mutex_t进行封装)
recurisive_mutex 可重入的互斥锁,在pthread_mutex_t的基础上加了一个可重入的属性
spin_metux 自旋锁,与pthread_spinlock_t类似,但是性能比pthread_spinlock_t低28%
queuing_metux 公平的互斥锁,严格按照等待锁的先后顺序获得锁
spin_rw_mutex 读写自旋锁,功能与pthread_rwlock_t一致,但是性能比pthread_rwlock_t高很多
queuing_rw_mutex 公平的读写读写锁,也是严格按照等待锁的先后顺序获得锁
以下是我对一个拥有3667527个节点的HASH表进行读操作所花费的时间,可以说明各种锁的性能:
(多线程的环境为:4CPU的电脑上使用四个线程进行同样的度操作,然后取四个线程读取的平均时间)
·单线程不加锁:0.818845s
·多线程使用pthread_mutex_t:120.978713s (很离谱吧…………我也吓了一跳)
·多线程使用pthread_rwlock_t:10.592172s (多个线程加读锁)
·多线程使用pthread_spinlock_t:4.766012s
·多个线程使用tbb::spin_mutex:6.638609s (从这里可以看出pthread的自旋锁比TBB的自旋锁性能高出28%)
·多个线程使用tbb::spin_rw_mutex:3.471757s (并行读的环境下,这是所有锁中性能最高的)
OK,有了以上的测试结果,何种环境该使用何种锁,不辨自明。
网友评论