随笔分类 -  Hbase

大数据相关的面试题(摘自网络)hbase,kafka,spark
摘要:1.讲讲你做的过的项目, 项目里有哪些难点重点呢? kafkaDirect ES /hive kafka producer 难点值得一提的有两点: 1.rdd中用到外部变量的时候如何处理 2.广播变量的更新 rdd处理kafka读过来的数据,这些数据引用外部的class来进行规则解析,规则的更新后怎 阅读全文

posted @ 2019-01-18 09:26 tneduts 阅读(1124) 评论(0) 推荐(0)

Hbase学习笔记
摘要:表存储的内容本身上没有类型,都是字节数组.存储的每一条数据都有一个行键,根据行键来划分给对应的regionserver来负责.它是面向列的存储,具体来说是面向列族的存储,每一个列族的数据,根据rowkey进行分发,分给特定的region.Hbase 是面向列族存储的,同属一个列族的数据是存在一起的。 阅读全文

posted @ 2017-09-12 08:25 tneduts 阅读(482) 评论(0) 推荐(0)

Hbase step by step 完全分布式安装
摘要:Step1: download and extract the packages: http://mirror.bit.edu.cn/apache/hbase/stable/ Step2: set the environment variable(not must, just easy to sta 阅读全文

posted @ 2013-12-29 11:43 tneduts 阅读(751) 评论(6) 推荐(0)

导航