随笔分类 -  bigdata-hbase

摘要:不错的大数据spark学习资料,连接过期在评论区评论,再给你分享 链接:https://pan.baidu.com/s/1T3-Tzz6qXMuQ_lyGc_0xbQ 提取码:zofz 阅读全文
posted @ 2018-09-25 23:31 新际航 阅读(377) 评论(2) 推荐(0)
摘要:创建hive与hbase的关联表 create external table hive_hbase(rowkey string,name string,addr string,topic string,creator_name string) stored by'org.apache.hadoop. 阅读全文
posted @ 2017-11-01 21:35 新际航 阅读(2393) 评论(0) 推荐(0)
摘要:一、服务端调优 1、参数配置 1)、hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB,比如大的put、使用缓存的scans)的时候,如果该值设置过大则会占用过多的内存,导致频繁的GC, 阅读全文
posted @ 2017-10-29 15:23 新际航 阅读(4219) 评论(0) 推荐(1)
摘要:有时,数据可以容易的存储在hive中,但是要导入到hbase里,可以不用写MR程序来操作,可以使用hive on hbase方式来创建相应的表关联关系来将hive中的数据导入到对应的hbase的表里,如下描述: 可以参考 hive与hbase关联表 1 、首先创建一张临时hive 内表: 2、将准备 阅读全文
posted @ 2017-09-19 10:28 新际航 阅读(1479) 评论(0) 推荐(0)
摘要:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 (1) 面向主题:指数据仓库中的数据是按照一定的主题域进行组织。 阅读全文
posted @ 2017-07-30 18:06 新际航 阅读(2917) 评论(0) 推荐(0)
摘要:python 是万能的,当然也可以通过api去操作big database 的hbase了,python是通过thrift去访问操作hbase 以下是在centos7 上安装操作,前提是hbase已经搭建成功了 1.安装thrift模块 下载thrift:https://pypi.python.or 阅读全文
posted @ 2017-06-28 23:51 新际航 阅读(15590) 评论(3) 推荐(0)
摘要:这是hbase 从0.9.x升级到1.x后HMaster与HRegionServer端口冲突问题 在hbase升级到1.0.0版本后,默认端口做了改动。其中16020端口是hmaster服务和hregionserver服务各自使用的默认端口,导致端口冲突。 官方文档相关信息如下 The HMaste 阅读全文
posted @ 2017-06-08 15:31 新际航 阅读(3357) 评论(0) 推荐(0)
摘要:hbase 修复使用hbck 事例: 阅读全文
posted @ 2017-05-27 15:23 新际航 阅读(3266) 评论(0) 推荐(0)
摘要:转载 http://www.cnblogs.com/bdifn/p/3801737.html 阅读全文
posted @ 2017-05-27 13:32 新际航 阅读(166) 评论(0) 推荐(0)
摘要:HBase是一种支持自动负载均衡的分布式KV数据库,在开启balance的开关(balance_switch)后,HBase的HMaster进程会自动根据指定策略挑选出一些Region,并将这些Region分配给负载比较低的RegionServer上。官方目前支持两种挑选Region的策略,一种叫做 阅读全文
posted @ 2017-05-26 16:05 新际航 阅读(5465) 评论(0) 推荐(0)