摘要: (1)、zookeeper.session.timeout:默认值3分钟,不可配置太短,避免session超时,hbase停止服务,线上生产环境由于配置为1分钟,出现过2次该原因导致的hbase停止服务,也不可配置太长,如果太长,当rs挂掉,zk不能快速知道,从而导致master不能及时对regio 阅读全文
posted @ 2019-12-02 19:13 大数据-云计算 阅读(184) 评论(0) 推荐(0)
摘要: 通过调用HTable.get(Get)方法可以根据一个指定的row key获取一行记录,同样HBase提供了另一个方法:通过调用HTable.get(List<Get>)方法可以根据一个指定的row key列表,批量获取多行记录,这样做的好处是批量执行,只需要一次网络I/O开销,这对于对数据实时性要 阅读全文
posted @ 2019-12-02 19:12 大数据-云计算 阅读(145) 评论(0) 推荐(0)
摘要: (1)、Scanner Caching hbase.client.scanner.caching配置项可以设置HBase scanner一次从服务端抓取的数据条数,默认情况下一次一条。通过将其设置成一个合理的值,可以减少scan过程中next()的时间开销,代价是scanner需要通过客户端的内存来 阅读全文
posted @ 2019-12-02 19:11 大数据-云计算 阅读(224) 评论(0) 推荐(0)
摘要: (1)数据库 hbase是一种面向列存储的非关系型数据库。 (2)用于存储结构化和非结构话的数据 适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。 (3)基于HDFS 数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进 阅读全文
posted @ 2019-12-02 19:09 大数据-云计算 阅读(185) 评论(0) 推荐(0)