摘要:
关于HBase的概述 1.hbase的特点 -》数据存储量可以达到亿级别数据维持在秒级 -》按列存储的数据库 -》能够存储上百万列 -》hbase的底层存储依赖于HDFS -》如何扩展hbase,增加DataNode节点 -》添加一台机器以后,如何保证负载均衡 -》多版本version,int值 2 阅读全文
posted @ 2017-08-22 22:19
因为专注。所以专业
阅读(161)
评论(0)
推荐(0)
摘要:
HBase的安装部署以及简单使用 一:下载安装 1.下载安装 2.开启hadoop与zookeeper 3.修改配置文件hbase-env export JAVA_HOME=/opt/modules/jdk1.7.0_67 export HBASE_MANAGES_ZK=false 》不使用hbas 阅读全文
posted @ 2017-08-22 22:18
因为专注。所以专业
阅读(327)
评论(0)
推荐(0)
摘要:
HBASE的读写以及client API 一:读写思想 1.系统表 hbase:namespace 存储hbase中所有的namespace的信息 hbase:meta rowkey:hbase中所有表的region的名称 column:regioninfo:region的名称,region的范围 阅读全文
posted @ 2017-08-22 22:17
因为专注。所以专业
阅读(516)
评论(0)
推荐(0)
摘要:
Hbase中rowkey设计原则 1.热点问题 在某一时间段,有大量的数据同时对一个region进行操作 2.原因 对rowkey的设计不合理 对rowkey的划分不合理 3.解决方式 rowkey是hbase的读写唯一标识 最大长度是64KB。 4.核心原则 设计必须按照业务需求进行设计 5.长度 阅读全文
posted @ 2017-08-22 22:11
因为专注。所以专业
阅读(601)
评论(0)
推荐(0)
摘要:
Hbase的属性 一:基本属性 1.查看属性 2.解释属性 NAME:列簇名 BLOOMFILTER:布隆过滤器,用于对storefile的过滤 共有三种类型: ROW:行健过滤 ROWCOL:行列过滤 NONE:无 VERSIONS:版本数 MIN_VERSIONS:最小版本数 TTL:版本存货活 阅读全文
posted @ 2017-08-22 22:10
因为专注。所以专业
阅读(332)
评论(0)
推荐(0)
摘要:
Region的预分区 1.预分区的方式 共有四种方式 2.帮助信息 help 'create' 3.第一种方式 4.在页面上查看效果(端口号:60010) 5.第二种方式 )创建文件,并在文件中书写分区的值 )创建表 6.观察效果 7.第三种方式 但是不常使用,因为这种方式是hash值进行分区,不再 阅读全文
posted @ 2017-08-22 22:08
因为专注。所以专业
阅读(596)
评论(1)
推荐(0)
摘要:
HBase的几种调优(GC策略,flush,compact,split) 一:GC的调优 1.jvm的内存 新生代:存活时间较短,一般存储刚生成的一些对象 老年代:存活时间较长,主要存储在应用程序中生命周期较长的对象 永久代:一般存储meta和class的信息 2.GC策略 Parrallel Ne 阅读全文
posted @ 2017-08-22 22:07
因为专注。所以专业
阅读(643)
评论(0)
推荐(0)
摘要:
HBase的完全分布式的搭建与部署,以及多master 一:前提准备 1.设置时间同步 2.清空logs,datas 3.格式化集群 bin/hdfs namenode -format 4.重启集群 sbin/start-dfs.sh sbin/start-yarn.sh 5.删除zookeeper 阅读全文
posted @ 2017-08-22 22:06
因为专注。所以专业
阅读(350)
评论(0)
推荐(0)
摘要:
HBase的数据迁移(含HDFS的数据迁移) 1.启动两个HDFS集群 hadoop0,hadoop1,都是伪分布式的集群 2.启动hadoop3的zookeeper与hbase 注意点:需要开启yarn服务,因为distcp需要yarn。 3.在hdfs上可以看到hadoop3上有表s1. 4.拷 阅读全文
posted @ 2017-08-22 22:05
因为专注。所以专业
阅读(593)
评论(0)
推荐(0)
摘要:
HBase的二级索引,以及phoenix的安装(需再做一次) 一:HBase的二级索引 1.讲解 uid+ts 11111_20161126111111:查询某一uid的某一个时间段内的数据 查询某一时间段内所有用户的数据:按照时间 索引表 rowkey:ts+uid 20161126111111— 阅读全文
posted @ 2017-08-22 22:04
因为专注。所以专业
阅读(356)
评论(0)
推荐(0)

浙公网安备 33010602011771号