随笔分类 -  Hive

摘要:Pig Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。 Hive Hive在Hadoop中扮演数据仓库的角色。Hiv 阅读全文
posted @ 2017-08-19 23:14 ahu-lichang 阅读(2404) 评论(0) 推荐(0)
摘要:hive利用hdfs存储数据文件,利用MapReduce查询数据。 数据库:支持在线联机业务(实时、事务控制) 数据仓库:存储历史数据,面向主题的。主要用于离线数据分析的。 阅读全文
posted @ 2017-05-07 21:47 ahu-lichang 阅读(540) 评论(0) 推荐(0)
摘要:hive1.2.1在hadoop2.6.4集群上的安装 hive只需在一个节点上安装即可,这里再hadoop1上安装 1、上传hive安装包到/usr/local/目录下 2、解压 tar -zxvf /usr/local/hive-1.2.1.tar.gz 重命名 mv hive-1.2.1 hi 阅读全文
posted @ 2017-05-06 10:30 ahu-lichang 阅读(1042) 评论(0) 推荐(0)
摘要:1.Hive1.1 在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具,可以把SQL转换为MapReduce中 阅读全文
posted @ 2017-04-08 22:45 ahu-lichang 阅读(4257) 评论(0) 推荐(0)