比特币 比较火  书本资料也较少

对cache缓存的概念就不讲了  

Filter 判断这个元素在不在 经过filter判断这个元素在不在如果不在的话肯定就不在

而如果在的话(有误差)在从数据库和内存中取

chache和filter 有一定的异曲同工之妙

我们来讲一下hash函数

 

 作用就是通过映射拿到值

hash有个问题 即使value 冲突 ?怎么解决 把映射到同一个value的key作为拉链存起来 比如列表

filter 和 cache 是互为互补的作用

filter和上述hash一样 不过是把

一个元素 散射到二进制向量里面来

 

布兰过滤器实现过程

映射到很长很长的二进制向量 比如int就是64的二进制向量

而布隆过滤器可以检索一个元素是否在一个集合中 

布隆过滤器优点和缺点

空间复杂度 事件复杂度远远小于其他算法  

缺点是勿失识别率和删除困难

为什么那么快

因为是二进制所以快 但是也无法避免一个新的问题 就是准确率低 (天下没有一块完整的蛋糕 不然为什么不直接用他?)

勿识别率低那么为什么还要?

首先讲一下他的勿识别率

首先元素在的时候才会有勿识别率  不在的时候肯定是不在的

如果在任何条件下 识别率都只有80%这样的情况 那么这个算法肯定是没用的 

布隆过滤器实现原理

 

 对于任何一个元素 使用映射函数 映射到 向量里 把 0 置为1  

新来一个w 用来查询 如果映射0的情况 那么这个w肯定不存在 

 

 大白话 :通过左边A和E把向量描红  右边有三个元素需要查找ACB 

发现a有 c没有 b有 实际上b是没有的 所以这就导致了勿失别

怎么解决勿失别

filter主要工作就是帮助过滤一下不存在的元素 所以说和cache一样挡了一层 如果不存在再去数据库查找 

所以后面还要跟一层数据管理系统 比如mysql 后面的是数据权威机构过滤器和cache是预先处理模块

 

 

 

 

 

 

 

 

 

 

posted on 2019-12-08 20:16  谢Rain  阅读(1045)  评论(0编辑  收藏  举报