linux设备驱动第五篇:驱动中的并发与竟态
综述
在上一篇介绍了linux驱动的调试方法,这一篇介绍一下在驱动编程中会遇到的并发和竟态以及如何处理并发和竞争。
首先什么是并发与竟态呢?并发(concurrency)指的是多个执行单元同时、并行被执行。而并发的执行单元对共享资源(硬件资源和软件上的全局、静态变量)的访问则容易导致竞态(race conditions)。可能导致并发和竟态的情况有:
- SMP(Symmetric Multi-Processing),对称多处理结构。SMP是一种紧耦合、共享存储的系统模型,它的特点是多个CPU使用共同的系统总线,因此可访问共同的外设和存储器。
- 中断。中断可 打断正在执行的进程,若中断处理程序访问进程正在访问的资源,则竞态也会发生。中断也可能被新的更高优先级的中断打断,因此,多个中断之间也可能引起并发而导致竞态。
- 内核进程的抢占。linux是可抢占的,所以一个内核进程可能被另一个高优先级的内核进程抢占。如果两个进程共同访问共享资源,就会出现竟态。
以上三种情况只有SMP是真正意义上的并行,而其他都是宏观上的并行,微观上的串行。但其都会引发对临界共享区的竞争问题。而解决竞态问题的途径是保证对共享资源的互斥访问,即一个执行单元在访问共享资源的时候,其他的执行单元被禁止访问。那么linux内核中如何做到对对共享资源的互斥访问呢?在linux驱动编程中,常用的解决并发与竟态的手段有信号量与互斥锁,Completions 机制,自旋锁(spin lock),以及一些其他的不使用锁的实现方式。下面一一介绍。
信号量与互斥锁
//声明信号量 struct semaphore sem; //初始化信号量 void sema_init(struct semaphore *sem, int val) //常用下面两种形式 #define init_MUTEX(sem) sema_init(sem, 1) #define init_MUTEX_LOCKED(sem) sema_init(sem, 0) //以下是初始化信号量的快捷方式,最常用的 DECLARE_MUTEX(name) //初始化name的信号量为1 DECLARE_MUTEX_LOCKED(name) //初始化信号量为0 //常用操作 DECLARE_MUTEX(mount_sem); down(&mount_sem); //获取信号量 ... critical section //临界区 ... up(&mount_sem); //释放信号量常用的down操作还有
// 类似down(),因为down()而进入休眠的进程不能被信号打断,而因为down_interruptible()而进入休眠的进程能被信号打断, // 信号也会导致该函数返回,此时返回值非0 int down_interruptible(struct semaphore *sem); // 尝试获得信号量sem,若立即获得,它就获得该信号量并返回0,否则,返回非0.它不会导致调用者睡眠,可在中断上下文使用 int down_trylock(struct semaphore *sem);
Completions 机制
</pre></div><div><pre name="code" class="cpp">// 定义完成量 struct completion my_completion; // 初始化completion init_completion(&my_completion); // 定义和初始化快捷方式: DECLEAR_COMPLETION(my_completion); // 等待一个completion被唤醒 void wait_for_completion(struct completion *c); // 唤醒完成量 void cmplete(struct completion *c); void cmplete_all(struct completion *c);
自旋锁
// 定义自旋锁 spinlock_t spin; // 初始化自旋锁 spin_lock_init(lock); // 获得自旋锁:若能立即获得锁,它获得锁并返回,否则,自旋,直到该锁持有者释放 spin_lock(lock); // 尝试获得自旋锁:若能立即获得锁,它获得并返回真,否则立即返回假,不再自旋 spin_trylock(lock); // 释放自旋锁: 与spin_lock(lock)和spin_trylock(lock)配对使用 spin_unlock(lock); 自旋锁的使用: // 定义一个自旋锁 spinlock_t lock; spin_lock_init(&lock); spin_lock(&lock); // 获取自旋锁,保护临界区 ... // 临界区 spin_unlock(); // 解锁
自旋锁持有期间内核的抢占将被禁止。自旋锁可以保证临界区不受别的CPU和本CPU内的抢占进程打扰,但是得到锁的代码路径在执行临界区的时候还可能受到中断和底半部(BH)的影响。为防止这种影响,需要用到自旋锁的衍生:
spin_lock_irq() = spin_lock() + local_irq_disable() spin_unlock_irq() = spin_unlock() + local_irq_enable() spin_lock_irqsave() = spin_lock() + local_irq_save() spin_unlock_irqrestore() = spin_unlock() + local_irq_restore() spin_lock_bh() = spin_lock() + local_bh_disable() spin_unlock_bh() = spin_unlock() + local_bh_enable()
其他的一些选择
不加锁算法
原子变量与位操作
// 设置原子变量的值 void atomic_set(atomic_t *v, int i); // 设置原子变量的值为i atomic_t v = ATOMIC_INIT(0); // 定义原子变量v,并初始化为0 // 获取原子变量的值 atomic_read(atomic_t *v); // 返回原子变量的值 // 原子变量加/减 void atomic_add(int i, atomic_t *v); // 原子变量加i void atomic_sub(int i, atomic_t *v); // 原子变量减i // 原子变量自增/自减 void atomic_inc(atomic_t *v); // 原子变量增加1 void atomic_dec(atomic_t *v); // 原子变量减少1 // 操作并测试:对原子变量进行自增、自减和减操作后(没有加)测试其是否为0,为0则返回true,否则返回false int atomic_inc_and_test(atomic_t *v); int atomic_dec_and_test(atomic_t *v); int atomic_sub_and_test(int i, atomic_t *v); // 操作并返回: 对原子变量进行加/减和自增/自减操作,并返回新的值 int atomic_add_return(int i, atomic_t *v); int atomic_sub_return(int i, atomic_t *v); int atomic_inc_return(atomic_t *v); int atomic_dec_return(atomic_t *v); 位原子操作: // 设置位 void set_bit(nr, void *addr); // 设置addr地址的第nr位,即将位写1 // 清除位 void clear_bit(nr, void *addr); // 清除addr地址的第nr位,即将位写0 // 改变位 void change_bit(nr, void *addr); // 对addr地址的第nr位取反 // 测试位 test_bit(nr, void *addr); // 返回addr地址的第nr位 // 测试并操作:等同于执行test_bit(nr, void *addr)后再执行xxx_bit(nr, void *addr) int test_and_set_bit(nr, void *addr); int test_and_clear_bit(nr, void *addr); int test_and_change_bit(nr, void *addr);
seqlock(顺序锁)
// 获得顺序锁 void write_seqlock(seqlock_t *sl); int write_tryseqlock(seqlock_t *sl); write_seqlock_irqsave(lock, flags) write_seqlock_irq(lock) write_seqlock_bh() // 释放顺序锁 void write_sequnlock(seqlock_t *sl); write_sequnlock_irqrestore(lock, flags) write_sequnlock_irq(lock) write_sequnlock_bh() // 写执行单元使用顺序锁的模式如下: write_seqlock(&seqlock_a); ... // 写操作代码块 write_sequnlock(&seqlock_a); 读执行单元操作: // 读开始:返回顺序锁sl当前顺序号 unsigned read_seqbegin(const seqlock_t *sl); read_seqbegin_irqsave(lock, flags) // 重读:读执行单元在访问完被顺序锁sl保护的共享资源后需要调用该函数来检查,在读访问期间是否有写操作。若有写操作,重读 int read_seqretry(const seqlock_t *sl, unsigned iv); read_seqretry_irqrestore(lock, iv, flags) // 读执行单元使用顺序锁的模式如下: do{ seqnum = read_seqbegin(&seqlock_a); // 读操作代码块 ... }while(read_seqretry(&seqlock_a, seqnum));
读取-拷贝-更新(RCU)
读取-拷贝-更新(RCU) 是一个高级的互斥方法,在合适的时候可以取得非常高的效率。RCU可以看作读写锁的高性能版本,相比读写锁,RCU的优点在于既允许多个读执行单元同时访问被保护的数据,又允许多个读执行单元和多个写执行单元同时访问被保护的数据。但是RCU不能替代读写锁,因为如果写比较多时,对读执行单元的性能提高不能弥补写执行单元导致的损失。由于平时应用较少,所以不做多说。小结
第一时间获得博客更新提醒,以及更多技术信息分享,欢迎关注个人微信公众平台:程序员互动联盟(coder_online),扫一扫下方二维码或搜索微信号coder_online即可关注,阅读android,chrome等多种热门技术文章。
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。