随笔分类 - bigdata-hbase
摘要:不错的大数据spark学习资料,连接过期在评论区评论,再给你分享 链接:https://pan.baidu.com/s/1T3-Tzz6qXMuQ_lyGc_0xbQ 提取码:zofz
阅读全文
摘要:创建hive与hbase的关联表 create external table hive_hbase(rowkey string,name string,addr string,topic string,creator_name string) stored by'org.apache.hadoop.
阅读全文
摘要:一、服务端调优 1、参数配置 1)、hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB,比如大的put、使用缓存的scans)的时候,如果该值设置过大则会占用过多的内存,导致频繁的GC,
阅读全文
摘要:有时,数据可以容易的存储在hive中,但是要导入到hbase里,可以不用写MR程序来操作,可以使用hive on hbase方式来创建相应的表关联关系来将hive中的数据导入到对应的hbase的表里,如下描述: 可以参考 hive与hbase关联表 1 、首先创建一张临时hive 内表: 2、将准备
阅读全文
摘要:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 (1) 面向主题:指数据仓库中的数据是按照一定的主题域进行组织。
阅读全文
摘要:python 是万能的,当然也可以通过api去操作big database 的hbase了,python是通过thrift去访问操作hbase 以下是在centos7 上安装操作,前提是hbase已经搭建成功了 1.安装thrift模块 下载thrift:https://pypi.python.or
阅读全文
摘要:这是hbase 从0.9.x升级到1.x后HMaster与HRegionServer端口冲突问题 在hbase升级到1.0.0版本后,默认端口做了改动。其中16020端口是hmaster服务和hregionserver服务各自使用的默认端口,导致端口冲突。 官方文档相关信息如下 The HMaste
阅读全文
摘要:转载 http://www.cnblogs.com/bdifn/p/3801737.html
阅读全文
摘要:HBase是一种支持自动负载均衡的分布式KV数据库,在开启balance的开关(balance_switch)后,HBase的HMaster进程会自动根据指定策略挑选出一些Region,并将这些Region分配给负载比较低的RegionServer上。官方目前支持两种挑选Region的策略,一种叫做
阅读全文

浙公网安备 33010602011771号