watacii

导航

2012年5月9日 #

bloom filter的使用场景和使用方法

摘要: 参考:http://blog.csdn.net/v_july_v/article/details/6685894http://blog.csdn.net/jiaomeng/article/details/1495500原理:使用一个位数组,大小为m位。K个哈希函数。n个数字的集合。给出一个元素,k次哈希,来判断是否已经存在在集合中。使用场景:可以用在集合求交集,数据判重等。使用方法:1. 最小错误率保证 位数组为0为1各占一半。2. 哈希函数个数 k = ln2(m/n) 3. 最小错误率为 0.6185^(m/n)4. m>=1.44n在增加了错误率这个因素之后,Bloom Filte 阅读全文

posted @ 2012-05-09 19:17 wataciii 阅读(356) 评论(0) 推荐(0) 编辑