会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一只竹节虫
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
15
16
17
18
19
2019年12月5日
MapReduce分区数据倾斜
摘要: 什么是数据倾斜? 数据不可避免的出现离群值,并导致数据倾斜,数据倾斜会显著的拖慢MR的执行速度 常见数据倾斜有以下几类 1.数据频率倾斜 某一个区域的数据量要远远大于其他区域 2.数据大小倾斜 一部分记录的大小远远大于平均值 解决数据倾斜的常用方法
阅读全文
posted @ 2019-12-05 11:12 一只竹节虫
阅读(297)
评论(0)
推荐(0)
2019年12月4日
Hbase和Hive在大数据架构中处在不同位置
摘要: 先放结论:Hbase和Hive在大数据架构中处在不同位置,Hbase主要解决实时数据查询问题,Hive主要解决数据处理和计算问题,一般是配合使用。一、区别:Hbase: Hadoop database 的简称,也就是基于Hadoop数据库,是一种NoSQL数据库,主要适用于海量明细数据(十亿、百亿)
阅读全文
posted @ 2019-12-04 10:10 一只竹节虫
阅读(265)
评论(0)
推荐(0)
上一页
1
···
15
16
17
18
19
公告