随笔分类 -  Hive

摘要:HiveSQL实现MR WordCount 数据 A A B A B C A B C D A B C D E MR处理过程 splite map shuffle reduce Hive处理过程 1、建表-行读取功能 create external table wc ( line string ) l 阅读全文
posted @ 2020-07-21 17:38 Loading~ 阅读(210) 评论(0) 推荐(0)
摘要:图片转载:https://www.cnblogs.com/share23/p/10161857.html 实例分析:https://www.cnblogs.com/frankdeng/p/9308654.html Hive触发MR:https://www.cnblogs.com/staryea/p/ 阅读全文
posted @ 2020-07-21 16:22 Loading~ 阅读(633) 评论(0) 推荐(0)
摘要:引入 非Java程序员利用SQL进行MR任务处理 简介 数据仓库:普通数据库做交互式查询;数据仓库离线数据分析、不支持实时性;数据仓库用ETL把不同数据源数据进行统一存储;时间拉链:仓库里数据不允许删除、修改; 解释器、编译器、优化器 元数据存储在关系型数据库中(不能存储在HDFS中,因为HDFS皆 阅读全文
posted @ 2020-07-19 17:05 Loading~ 阅读(363) 评论(0) 推荐(0)