Linux的原子操作以及LOCK前缀

关于原子操作

所谓原子操作,就是该操作绝不会在执行完毕前被任何其他任务或事件打断,也就说,它的最小的执行单位不可能有比它更小的执行单位,因此这里的原子实际是使用了物理学里的物质微粒的概念。

原子操作需要硬件的支持,因此是架构相关的,其API和原子类型的定义都定义在内核源码树的include/asm/atomic.h文件中,它们都使用汇编语言实现,因为C语言并不能实现这样的操作。

原子操作主要用于实现资源计数,很多引用计数(refcnt)就是通过原子操作实现的。原子类型定义如下:

typedef struct { volatile int counter; } atomic_t; 

volatile修饰字段告诉gcc不要对该类型的数据做优化处理,对它的访问都是对内存的访问,而不是对寄存器的访问。 

原子操作API包括:  

atomic_read(atomic_t * v);                                 //该函数对原子类型的变量进行原子读操作,它返回原子类型的变量v的值。  

atomic_set(atomic_t * v, int i);                           //该函数设置原子类型的变量v的值为i。  
 
void atomic_add(int i, atomic_t *v);                       //该函数给原子类型的变量v增加值i。  

atomic_sub(int i, atomic_t *v);                            //该函数从原子类型的变量v中减去i。  

int atomic_sub_and_test(int i, atomic_t *v);               //该函数从原子类型的变量v中减去i,并判断结果是否为0,如果为0,返回真,否则返回假。  

void atomic_inc(atomic_t *v);                              //该函数对原子类型变量v原子地增加1。  
 
void atomic_dec(atomic_t *v);                              //该函数对原子类型的变量v原子地减1。  

int atomic_dec_and_test(atomic_t *v);                      //该函数对原子类型的变量v原子地减1,并判断结果是否为0,如果为0,返回真,否则返回假。  

int  atomic_inc_and_test(atomic_t *v);                     //该函数对原子类型的变量v原子地增加1,并判断结果是否为0,如果为0,返回真,否则返回假。  

int atomic_add_negative(int i, atomic_t *v);               //该函数对原子类型的变量v原子地增加I,并判断结果是否为负数,如果是,返回真,否则返回假。  

int atomic_add_return(int i, atomic_t *v);                 //该函数对原子类型的变量v原子地增加i,并且返回指向v的指针。  

int atomic_sub_return(int i, atomic_t *v);                 //该函数从原子类型的变量v中减去i,并且返回指向v的指针。  

int atomic_inc_return(atomic_t * v);                       //该函数对原子类型的变量v原子地增加1并且返回指向v的指针。  

int atomic_dec_return(atomic_t * v);                       //该函数对原子类型的变量v原子地减1并且返回指向v的指针。 

 


原子操作通常用于实现资源的引用计数,在TCP/IP协议栈的IP碎片处理中,就使用了引用计数,碎片队列结构struct ipq描述了一个IP碎片,字段refcnt就是引用计数器,它的类型为atomic_t,当创建IP碎片时(在函数ip_frag_create中),使用atomic_set函数把它设置为1,当引用该IP碎片时,就使用函数atomic_inc把引用计数加1。 

 

 

关于LOCK

LOCK前缀作用于单个指令上,它对中断没有任何影响,因为中断只能在指令之间产生。LOCK前缀的真正作用是保持对系统总线的控制,直到整条指令执行完毕。它在一条指令多次访问内存的时候相当有用。

比如一个共享计数器,我们需要对它进行原子递增操作,需要做如下工作:

1)从内存读取该计数器的值,临时将其保存在CPU内部寄存器中。 2)增加读取到的值。 3)将被修改后的值写回内存。

在x86体系结构中,这个递增操作可以在单个指令中完成,因此中断不会对该递增操作产生影响。但是该指令有两次内存访问操作,读和写,另外一个CPU或者核(core)可能同时对该计数器进行递增操作。如果另外一个CPU/核(core)在第1步完成后,第3步完成前读取该计数器的值,那么两个CPU/核(core)都使用被修改之前的计数器值并对其进行递增操作。这样就出现了错误的情况。

如果在此时使用了LOCK前缀,第一个核在对该计数器进行操作的时候,保持对总线的控制权,直到两次访问内存的操作都完毕。这样做的结果是,第二个CPU/核(Core)会延迟一段时间,知道第一个CPU完成所有操作为止。

这里的第二个CPU/核(core)可以是DMA操作,因此在使用DMA操作的时候尤其要小心。如果处理器使用了缓存,事情可能由于缓存一致性问题变得更糟糕。同样,如果使用了虚拟内存,也会增加该问题的严重程度。因此,在单个处理器的特殊指令前,最好使用lock前缀。

posted on 2012-07-20 12:45  as_  阅读(3130)  评论(0编辑  收藏  举报

导航