摘要:        
一、安装前提 1、HBase 依赖于 HDFS 做底层的数据存储 2、HBase 依赖于 MapReduce 做数据计算 3、HBase 依赖于 ZooKeeper 做服务协调 4、HBase源码是java编写的,安装需要依赖JDK 1、版本选择 打开官方的版本说明http://hbase.apac    阅读全文
posted @ 2018-08-12 21:49
Frankdeng
阅读(5156)
评论(1)
推荐(1)
        
            
        
        
摘要:        
一 数据仓库的概念 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。     阅读全文
posted @ 2018-08-12 19:52
Frankdeng
阅读(30471)
评论(2)
推荐(2)
        
            
        
        
摘要:        
一 Hive SQL练习之影评案例 案例说明 现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender String, Age Int, Occupation String, Zipco    阅读全文
posted @ 2018-08-12 18:54
Frankdeng
阅读(11267)
评论(1)
推荐(4)
        
            
        
        
摘要:        
一、Fetch抓取 1、理论分析 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。 在hive-default    阅读全文
posted @ 2018-08-12 18:32
Frankdeng
阅读(18981)
评论(2)
推荐(7)
        


浙公网安备 33010602011771号