摘要:
from:https://blog.csdn.net/zhanglh046/article/details/78505038 一 Spark SQL运行架构Spark SQL对SQL语句的处理和关系型数据库类似,即词法/语法解析、绑定、优化、执行。Spark SQL会先将SQL语句解析成一棵树,然后 阅读全文
posted @ 2020-03-08 15:31
bonelee
阅读(846)
评论(0)
推荐(0)
摘要:
Hive架构和工作原理 from:https://cloud.tencent.com/developer/news/362488 一、Hive 架构 下面是Hive的架构图。 Hive的体系结构可以分为以下几部分: 1、用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是CLI,Cl 阅读全文
posted @ 2020-03-08 12:01
bonelee
阅读(3708)
评论(0)
推荐(0)
摘要:
一文弄懂Hive基本架构和原理from:https://blog.csdn.net/oTengYue/article/details/91129850文章目录 概述 Hive架构 Hive数据模型 Hive SQL的编译 Hive执行计划 Hive Sql的MapReduce实现原理 Join的实现 阅读全文
posted @ 2020-03-08 11:52
bonelee
阅读(1938)
评论(0)
推荐(0)
摘要:
应届生小祖参加了个需求分析会回来后跟我说被产品怼了一句: "不就是写SQL吗,要那么久吗" 我去,欺负我小弟,这我肯定不能忍呀,于是我写了一篇文章发在了公司的wiki: 贴出来给大家看看,省略了一些敏感的内容。 当然内部版言辞也会温和一点,嘻嘻 在哪里写SQL? 这个问题高级点的问法是用哪种SQL引 阅读全文
posted @ 2020-03-08 11:32
bonelee
阅读(691)
评论(0)
推荐(0)
摘要:
大数据 “数据倾斜”的问题 大数据首席数据师 0.7862018.11.13 11:21:28字数 897阅读 4,411 一、Hadoop中的数据倾斜: 什么是数据倾斜?(见下图) 简单来说数据倾斜就是数据的key 的分化严重不均,造成一部分数据很多,一部分数据很少的局面。 举个 word cou 阅读全文
posted @ 2020-03-08 11:27
bonelee
阅读(740)
评论(0)
推荐(0)

浙公网安备 33010602011771号