摘要: >中23章介绍的布隆过滤器(Bloom filter),以下是一些算法的实现及应用1.算法应用在如那件设计中有个最基本的功能是判断某个元素是否在集合当中,比如爬虫中验证一个url是否被收录过,如果用普通的hash来判断那需要的内存容量是惊人的。布隆过滤器的作用就是能够降低内存用量,他只需要hash表的1/8到1/4就能够解决问题。3.算法实现3.1生成指纹函数,这里做了一个简化void make_fingers(const string &url, const vector&fingers){ for (int i=0; i3.2生成映射,将八个指纹映射到1~MAX中的一 阅读全文
posted @ 2013-09-16 16:50 Yancey咖啡 阅读(384) 评论(0) 推荐(0)