2016年3月11日
摘要: 海量数据处理的常用技术可分为: 外排序:因为海量数据无法全部装入内存,所以数据的大部分存入磁盘中,小部分在排序需要时存入内存。 MapReduce:分布式处理技术 hash技术:以Bloom filter技术为代表 外排序:主要适用于大数据的排序、去重。 分布式处理技术:MapReduce 技术思想 阅读全文
posted @ 2016-03-11 22:13 松伯 阅读(653) 评论(0) 推荐(0)