海量数据处理面试题汇总

方法出自:http://www.cnblogs.com/flyoung2008/p/3268085.html

面试题:http://blog.csdn.net/dazhong159/article/details/7907174

1. hash(hash统计)

   http://blog.csdn.net/zxycode007/article/details/6999984

2. bit-map

  http://blog.csdn.net/hguisu/article/details/7880288

3. 外部排序

  http://see.xidian.edu.cn/cpp/html/1045.html

4. 倒排索引

  http://www.cnblogs.com/fly1988happy/archive/2012/04/01/2429000.html

5. 字典树

  http://www.cnblogs.com/dolphin0520/archive/2011/10/11/2207886.html

6. 优化数据库

  http://blog.csdn.net/lzw190/article/details/6221143

7. 布隆过滤器

  http://blog.csdn.net/v_july_v/article/details/6685894/

8. 堆

  最大堆 求前n小

  最小堆 求前n大

9. 双层桶法

  http://blog.sina.com.cn/s/blog_94d959420100z5j9.html

10. MapReduce法

posted @ 2014-09-24 14:12  oudan  阅读(150)  评论(0编辑  收藏  举报