学习flush与split时所遇的问题

因为region中的值都是以key来排序的,但是flush操作是生成一个新Store file(HFile),那么还怎么保持region中key的有序呢?

然后又延伸出一个问题:flush操作生成的Store file,为什么大小不一?见下图(与compaction有关)

原因是:

flush是对一个HRegion来定义的,所以flush时,是对其所有的Store里的MemStore进行flush.即有可能会flush出多个文件,对应在不同的Store里,这样就解释了为什么大小不一。
 
那么这么多storefile,怎么保持region中key有序呢,答案是:keyvalue是以storefile为排序的单位的。即每个storefile都是按照key来排序的,但同一系列的key可能在不同storefile,compaction过程中也保持了key的有序。查找的话是一个storefile,一个storefile这样查找的。
 
我们都知道region的split是将split一分为二,那么它在storefile层次是如何切分的呢?答案是它把所有的storefile也一分为二。
posted @ 2012-12-05 16:48  hdu2012  阅读(168)  评论(0编辑  收藏  举报