哈希表与布隆过滤器

七夕,一个人。

读了吴军的《数学之美》23章布隆过滤器,对哈希表的存储效率产生了疑问:原文“哈希表的存储效率只有50%,因此一个Email地址需要占用16个字节”用于校对一个元素是否在一个集合中的哈希表需要存储元素本身?而不是只需要对应哈希值的地方置一?

 

看了一篇博文《布隆过滤器(Bloom Filter) 详解》,详细分析了哈希表和布隆过滤器。

 

在一般的哈希表中若要 校对一个元素是否在一个集合中 需要存储元素本身来解决冲突(collision)的问题。若不加想存元素本身 而误判率(这里相当于冲突率)保持,哈希表的空间复杂度会更大。

在《布隆过滤器(Bloom Filter) 详解》中有详细数据的举例 和 公式一步步的推导。

 

posted @ 2014-08-03 00:21  Orez  阅读(300)  评论(0)    收藏  举报