摘要:
一文弄懂Hive基本架构和原理from:https://blog.csdn.net/oTengYue/article/details/91129850文章目录 概述 Hive架构 Hive数据模型 Hive SQL的编译 Hive执行计划 Hive Sql的MapReduce实现原理 Join的实现 阅读全文
posted @ 2020-03-08 11:52
bonelee
阅读(1943)
评论(0)
推荐(0)
摘要:
应届生小祖参加了个需求分析会回来后跟我说被产品怼了一句: "不就是写SQL吗,要那么久吗" 我去,欺负我小弟,这我肯定不能忍呀,于是我写了一篇文章发在了公司的wiki: 贴出来给大家看看,省略了一些敏感的内容。 当然内部版言辞也会温和一点,嘻嘻 在哪里写SQL? 这个问题高级点的问法是用哪种SQL引 阅读全文
posted @ 2020-03-08 11:32
bonelee
阅读(693)
评论(0)
推荐(0)
摘要:
大数据 “数据倾斜”的问题 大数据首席数据师 0.7862018.11.13 11:21:28字数 897阅读 4,411 一、Hadoop中的数据倾斜: 什么是数据倾斜?(见下图) 简单来说数据倾斜就是数据的key 的分化严重不均,造成一部分数据很多,一部分数据很少的局面。 举个 word cou 阅读全文
posted @ 2020-03-08 11:27
bonelee
阅读(759)
评论(0)
推荐(0)

浙公网安备 33010602011771号