alexking

学习笔记

导航

随笔分类 -  数据库

大数据量,海量数据 处理方法归纳总结
摘要:1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明存在,很明显这个过程并不保证查找的结果是100%正确的。同时也不支持删除一个已经插入的关键字,因为该关键字对应的位会牵动到其他的关键字。所以一个简单的改进就是 countingBloom filter,用一个counter数组代替位数组,就可以支持删除了。还有一个比较重要的问题,如何根据输入元素个数n,确定位数组m的大小及hash函数个数。当hash函数个数k 阅读全文

posted @ 2012-01-15 10:34 alexking

MongoDB入门6——查询(二)
摘要:3.查询中null的处理 null的匹配非常有意思:null不仅仅会匹配到指定键的值确实等于null的文档,并且还会匹配到查询所制定键不存在的文档。例如,插入下面这三个文档:Javascript代码>db.users.insert({"name":"Tom","age":20,"job":"Sales"});>db.users.insert({"name":"Sam","age":25,"job":&qu 阅读全文

posted @ 2012-01-07 10:15 alexking