[Linux] 理解CPU缓存的伪共享问题

CPU是有高速缓存的 , 三级缓存分别是 L1 ,   L2   ,   L3

L1缓存最贴近CPU , 所以速度也最快

数据在缓存中是一行一行存储的 , L1缓存一般的一行缓存64字节

 

一行能缓存64个字节  , 因为一个变量可能没有64字节大小 , 所以可能会缓存好几个变量

缓存需要保证一致性, 也就是当变量修改的时候 , 缓存必须得失效 , 重新在内存中读取变量加载到缓存里

 

当一行里有好几个变量的时候 , 其中一个变量修改了 , 这一行的数据都得失效 

并且同一时间只允许一个线程操作缓存行 ,

当并发比较高修改比较频繁时候 , 缓存的性能就下降了很多 , 这就是伪共享问题

 

一般解决这个问题是用的内存对齐填充来解决 , 也就是我一个变量占满这一行64字节 , 当然这样也比较浪费缓存

我们常说的局部性原理也与CPU缓存有关 ,

当我们使用数组的时候 , 内存地址是连续的 , 这样就很有可能放在一行里 , 每次CPU从缓存里读一行就能读到相邻的变量 , 速度会很快

posted @ 2021-05-11 10:07  陶士涵  阅读(13)  评论(0编辑  收藏  举报