随笔分类 -  算法-hash

摘要:【转】cuck hash https://coolshell.cn/articles/17225.html (感谢网友 @我的上铺叫路遥 投稿) 对于海量数据处理业务,我们通常需要一个索引数据结构,用来帮助查询,快速判断数据记录是否存在,这种数据结构通常又叫过滤器(filter)。考虑这样一个场景, 阅读全文
posted @ 2020-04-07 20:37 tmortred 阅读(597) 评论(1) 推荐(0)
摘要:就是说你有一组函数H包含|H|个函数,把所有的关键字散列成0~m 1的哈希值。我们把H设计成有这样一个性质:对于所有的不相等关键字x和y,使x和y的散列值相等的函数h的个数等于|H|/m 那么,在不知道选择了哪个函数时,两个不相等的关键字x和y会有相同的哈希值的概率可以计算出来:在最开始时随机选一个 阅读全文
posted @ 2020-04-02 21:07 tmortred 阅读(186) 评论(1) 推荐(0)
摘要:【转】原作来自 https://www.cnblogs.com/z941030/p/9218356.html 算法背景 如果想判断一个元素是不是在一个集合里,一般想到的是将集合中所有元素保存起来,然后通过比较确定。链表、树、散列表(又叫哈希表,Hash table)等等数据结构都是这种思路,存储位置 阅读全文
posted @ 2020-04-01 21:39 tmortred 阅读(154) 评论(1) 推荐(0)
摘要:【转】http://blog.csdn.net/pipisorry/article/details/62443757 BitMapBitMap从字面的意思,很多人认为是位图,其实准确的来说,翻译成基于位的映射。 在所有具有性能优化的数据结构中,大家使用最多的就是hash表,是的,在具有定位查找上具有 阅读全文
posted @ 2020-04-01 21:30 tmortred 阅读(224) 评论(1) 推荐(0)