摘要:        
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓    阅读全文
        
            posted @ 2016-12-28 16:52
杰我天下
阅读(721)
评论(0)
推荐(0)
        
            
        
        
摘要:        
本文转自hbase。收藏学习下。 随着大数据的越来越普及,HBase也变得越来越流行。会用HBase现在已经变的并不困难,然而,怎么把它用的更好却并不简单。那怎么定义‘用的好’呢?很简单,在保证系统稳定性、可用性的基础上能够用最少的系统资源(CPU,IO等)获得最好的性能(吞吐量,读写延迟)就是’用    阅读全文
        
            posted @ 2016-12-28 11:47
杰我天下
阅读(5413)
评论(0)
推荐(0)
        
                    
                
        
浙公网安备 33010602011771号