bloom布隆过滤器

1.bloom简介

  

2.bloom的设计思想

  bloom实现的总体思想是使用bitset,存储数据的hash值,一般一个数据会使用多个hash函数生成值

  这样查看目标数据是否存在的时候,只要看相应的hash值对应的位置是否都为1,即可判断是否不存在。

  这里要注意的是:

    bloom返回true,不代表一定存在,因为有一定的误差范围

    bloom返回false,则说明数据一定不存在,因为同样的数据产生的hash值总是相同,所以只要加入bitset,则下次查询相应位一定为1.

    bloom能精确判断数据不存在,模糊判断数据存在(精度度可控制),不能反查出原生数据

 

 下图是bloom命中,而且实际也存在这个值的情况

  

  下图是bloom命中,但是实际不存在这个值的情况

  

 

  下面是bloom没命中,实际不存在这个值的情况(bloom没命中,则肯定不会存在这个值)

  

 

 

 

  下面是查询时bloom过滤器的工作逻辑

 

   

 

 参考文档:

  https://www.jasondavies.com/bloomfilter/

  https://hackernoon.com/probabilistic-data-structures-bloom-filter-5374112a7832

posted @ 2020-05-07 21:46  exact  阅读(204)  评论(0编辑  收藏  举报