02 2017 档案

[How to]HBase集群备份方法
摘要:1.简介 当HBase数据库中存在非常重要的业务数据的时候为了保护数据的可以对数据进行备份处理。对于HBase来说从备份操作来看可分为离线备份和在线备份。 2. 前准备 在测试环境上准备有哦两套HBase集群,资源有限原因他们共享一个hdfs集群和zookeeper,通过配置不同node路径和数据路 阅读全文

posted @ 2017-02-17 17:58 xf-xrh-xf 阅读(5739) 评论(0) 推荐(1)

[How to] HBase的bulkload使用方法
摘要:1.简介 将数据插入HBase表中的方法很多,我们可以通过TableOutputFormat以Mapreduce on HBase的方式将数据插入,也可以单纯的使用客户端API将数据插入。但是以上方法效率并不高。 而使用BulkLoad特性能够利用MR计算框架将源数据直接生成内部的hfile格式,然 阅读全文

posted @ 2017-02-14 23:39 xf-xrh-xf 阅读(3483) 评论(0) 推荐(1)

How to recover NameNode HA, when one accidentally formated one of the two NameNodes
摘要:https://community.hortonworks.com/content/supportkb/48981/how-to-recover-namenode-ha-when-one-accidentally-f.html 阅读全文

posted @ 2017-02-14 16:46 xf-xrh-xf 阅读(131) 评论(0) 推荐(0)

[How to] MapReduce on HBase ----- 简单二级索引的实现
摘要:1.简介 MapReduce计算框架是二代hadoop的YARN一部分,能够提供大数据量的平行批处理。MR只提供了基本的计算方法,之所以能够使用在不用的数据格式上包括HBase表上是因为特定格式上的数据读取和写入都实现了各自的inputformat和outputformat,这样MR就通过这两个接口 阅读全文

posted @ 2017-02-13 21:27 xf-xrh-xf 阅读(2387) 评论(0) 推荐(0)

[How to] 使用HBase协处理器---Endpoint客户端代码的实现
摘要:1.简介 不同于Observer协处理器,EndPoint由于需要同region进行rpc服务的通信,以及客户端出数据的归并,需要自行实现客户端代码。 基于[How to] 使用HBase协处理器 Endpoint服务端的实现这篇文章,我们继续实现其客户端代码。 2.客户端代码实现方式介绍 目前基于 阅读全文

posted @ 2017-02-09 18:24 xf-xrh-xf 阅读(1006) 评论(0) 推荐(0)

[How to] 使用HBase协处理器---Endpoint服务端的实现
摘要:1.简介 前篇文章[How to] 使用HBase协处理器 基本概念和regionObserver的简单实现中提到了两种不同的协处理器,并且实现了regionObserver。 本文将介绍如何使用EndPoint协处理器类型。 与Observer类型不同的是,Endpoint协处理器需要与服务区直接 阅读全文

posted @ 2017-02-09 15:27 xf-xrh-xf 阅读(4549) 评论(0) 推荐(0)

[How to] 使用HBase协处理器---基本概念和regionObserver的简单实现
摘要:1. 简介 对于HBase的协处理器概念可由其官方博文了解:https://blogs.apache.org/hbase/entry/coprocessor_introduction 总体来说其包含两种协处理器:Observers和Endpoint。 其中Observers可以理解问传统数据库的触发 阅读全文

posted @ 2017-02-08 10:50 xf-xrh-xf 阅读(12997) 评论(2) 推荐(2)

导航