摘要:针对海量数据,可以使用的方法非常多,常见的方法有:Hash法,Bit-map法,Bloom filter法,数据库优化法,倒排索引法,外排序法,Trie树,堆,双层桶排序法(simhash法和多层划分法,实际上都是多机器分而治之的思想)以及mapreduce法。 Hash主要是用来进行”快速存... 阅读全文
posted @ 2014-08-14 16:07 weixliu 阅读 (898) 评论 (0) 编辑