上一页 1 ··· 60 61 62 63 64 65 66 67 68 ··· 119 下一页

2013年11月25日

熵推导

摘要: 信息论 信息是关于事物的运动状态和规律的认识,它可以脱离具体的事物而被摄取、传输、存贮、处理和变换。 信息论,就是用数理统计方法研究信息的基本性质以及度量方法,研究最佳解决信息的摄取、传输、存贮、处理和变换的一般规律的科学。它的成果将为人们广泛而有效地利用信息提供基本的技术方... 阅读全文

posted @ 2013-11-25 12:42 代码王子 阅读(639) 评论(0) 推荐(0)

提高HBase写性能

摘要: 以下为使用hbase一段时间的三个思考,由于在内存充足的情况下hbase能提供比较满意的读性能,因此写性能是思考的重点。希望读者提出不同意见讨论 1 autoflush=false的影响 无论是官方还是很多blog都提倡为了提高hbase的写入速度而在应用代码中设置autoflu... 阅读全文

posted @ 2013-11-25 12:41 代码王子 阅读(137) 评论(0) 推荐(0)

HBase运维经验

摘要: http://www.qconbeijing.com/download/Nicolas.pdf 重点看了下facebook做了哪些改进以及他们的运维经验,比较重要的有以下几点: 改进: 1 加强了行级的ACID约束 2 改善了数据的分布规则,可以配置hdfs的replicas所在节点 3 改... 阅读全文

posted @ 2013-11-25 12:41 代码王子 阅读(84) 评论(0) 推荐(0)

HBase缓存的使用

摘要: hbase中的缓存分了两层:memstore和blockcache。 其中memstore供写使用,写请求会先写入memstore,regionserver会给每个region提供一个memstore,当memstore满64MB以后,会启动flush刷新到磁盘。当memstor... 阅读全文

posted @ 2013-11-25 12:41 代码王子 阅读(220) 评论(0) 推荐(0)

HDFS APPEND性能测试

摘要: hbase在写入数据之前会先写hlog,hlog目前是sequencefile格式,采用append的方式往里追加数据。之前团队的同学测试关闭hlog会一定程序上提升写hbase的稳定性。而在我之前的想象中,hlog的写入速度应该是稳定的。于是写了个append程序专门测试hdfs的append... 阅读全文

posted @ 2013-11-25 12:41 代码王子 阅读(343) 评论(0) 推荐(0)

Hbase问题

摘要: Q: .meta.和root表是否要分裂? A: meta表和root表不会分裂,代码中有所判断。 Q: 如果不分裂,那么都只有1个region? A: ... (查看代码后)A: meta和root表是要split的,.meta.和-root-不split是在0.20... 阅读全文

posted @ 2013-11-25 12:41 代码王子 阅读(95) 评论(0) 推荐(0)

HBase中缓存的优先级

摘要: ava代码 // Instantiate priority buckets BlockBucket bucketSingle = new BlockBucket(bytesToFree, blockSize, singleSize()); BlockBucket bucket... 阅读全文

posted @ 2013-11-25 12:40 代码王子 阅读(130) 评论(0) 推荐(0)

HBase中创建索引

摘要: hbasene(https://github.com/akkumar/hbasene)是开源项目,在hbase存储上封装使用Lucene来创建索引,代码API非常简单,熟悉lucene的朋友可以很方便地创建。 以下为测试代码,完成读取一张hbase上记录url和用户id的表,对其... 阅读全文

posted @ 2013-11-25 12:40 代码王子 阅读(232) 评论(0) 推荐(0)

多Region下HBase写入问题

摘要: 最近在集群上发现hbase写入性能受到较大下降,测试环境下没有该问题产生。而生产环境和测试环境的区别之一是生产环境的region数量远远多于测试环境,单台regionserver服务了约3500个region。 通过jstack工具检查到大半写入线程BLOCKED状态在"publ... 阅读全文

posted @ 2013-11-25 12:40 代码王子 阅读(228) 评论(0) 推荐(0)

Zookeeper管理多个HBase集群

摘要: zookeeper是hbase集群的"协调器"。由于zookeeper的轻量级特性,因此我们可以将多个hbase集群共用一个zookeeper集群,以节约大量的服务器。多个hbase集群共用zookeeper集群的方法是使用同一组ip,修改不同hbase集群的"zookeeper.zno... 阅读全文

posted @ 2013-11-25 12:40 代码王子 阅读(218) 评论(0) 推荐(0)

上一页 1 ··· 60 61 62 63 64 65 66 67 68 ··· 119 下一页

导航