LRU算法和LFU算法有什么区别

悲观者从机会中看到困难。乐观者从困难中看到机会。
——温斯顿·丘吉尔

LFU内存淘汰算法是Redis4.0之后新增内存淘汰策略,那为什么要新增这个算法?那肯定是为了解决LRU算法的问题。

什么是LRU算法

LRU全称是Least Recently Used翻译为最近最少使用,会选择淘汰最近最少使用的数据。

传统LRU算法的实现是基于「链表」,链表中的元素按照操作顺序从前往后排列,最新操作的键会被移动到表头,当需要内存淘汰时,只需要删除链表尾部的元素即可,因为链表尾部的元素就代表最久未被使用的元素。

Redis并没有使用这样的方式实现LRU算法,因为传统的LRU算法存在两个问题:

需要用链表管理所有的缓存数据,这会带来额外的空间开销;

当有数据被访问时,需要在链表上把该数据移动到头端,如果有大量数据被访问,就会带来很多链表移动操作,会很耗时,进而会降低Redis缓存性能。

Redis是如何实现LRU算法的

Redis实现的是一种近似LRU算法,目的是为了更好的节约内存,它的实现方式是在Redis的对象结构体中添加一个额外的字段,用于记录此数据的最后一次访问时间

当Redis进行内存淘汰时,会使用随机采样的方式来淘汰数据,它是随机取5个值(此值可配置),然后淘汰最久没有使用的那个

Redis实现的LRU算法的优点:

  • 不用为所有的数据维护一个大链表,节省了空间占用;
  • 不用在每次数据访问时都移动链表项,提升了缓存的性能;

但是LRU算法有一个问题,无法解决缓存污染问题,比如应用一次读取了大量的数据,而这些数据只会被读取这一次,那么这些数据就会留存在Redis缓存中很长一段时间,造成缓存污染。

因此,在Redis4.0之后引入了LFU算法来解决这个问题。

什么是LFU算法

LFU全称是Least Frequently Used 翻译为最近不常用,LFU算法是根据数据访问次数来淘汰数据的,它的核心思想是"如果数据过去被多次访问,那么将来被访问的频率也更高"。

所以,LFU算法会记录每个数据的访问次数,当一个数据被再次访问时,就会增加该数据的访问次数。这样就解决了偶尔被访问一次之后,数据留存在缓存中很长一段时间的问题,相比于LRU算法也更合理一些。

Redis是如何实现LFU算法的

LFU算法相比于LRU算法的实现,多记录了「数据的访问频次」的信息。Redis对象的结构如下:

typedef struct redisObject{
			...
    	// 24 bits,用于记录对象的访问信息
      unsigned lru:24;
}robj;

Redis对象头中的lru字段,在LRU算法下和LFU算法下使用方式并不相同。

在LRU算法中,Redis对象头的24bits的lru字段是用来记录key的访问时间戳,因此在LRU模式下,Redis可以根据对象头中的lru字段记录的值,来比较最后一次key的访问时间长,从而淘汰最久未被使用的key

在LFU算法中,Redis对象头的24bits的lru字段被分成两段来存储,高 16bit 存储ldt(Last Derement Time),低 8bit 存储logc(Logistic Counter)

  • ldt是用来记录key的访问时间戳;
  • logc是用来记录key的访问频次,它的值越小表示使用频率越低,越容易淘汰,每个新加入的key的logc初始值为5.

注意,logc并不是单纯的访问次数,而是访问频次(访问频率),因为logc会随时间推移而衰减的。

在每次key被访问时,会先对logc做一个衰减操作,衰减的值跟前后访问时间的差距有关系,如果上一次访问的时间与这一次访问的时间差距很大,那么衰减的值就越大,这样实现的LFU算法是根据访问频率来淘汰数据的,而不是访问次数。访问频率需要考虑key的访问是多长时间段内发生的。key的先前访问距离当前时间越长,那么这个key的访问频率相应的也就会降低,这样被淘汰的概率也会更大。

对logc做完衰减操作后,就开始对logc进行增加操作,增加操作并不是单纯的+1,而是根据概率增加,如果logc越大的key,它的logc就越难再增加。

所以,Redis在访问key时,对于logc是这样变化的:

  1. 先按照上次访问距离当前的时长,来对logc进行衰减;
  2. 然后,再按照一定概率增加logc的值

redis.conf提供了两个配置项,用于调整LFU算法从而控制logc的增长和衰减:

  • lfu-decay-time 用于调整logc的衰减速度,它是一个以分钟为单位的数值,默认值为1,lfu-decay-time值越大,衰减越慢;
  • lfu-log-factor 用于调整logc的增长速度,lfu-log-factor值越大,logc增长越慢

原文

posted @ 2025-04-08 13:23  Tsukinor  阅读(152)  评论(0)    收藏  举报