B-树的一些理解

B-树

1、B树(B-tree、B-树)

  • B树是一种平衡的多路搜索树,多用于文件系统、数据库的实现
  • 仔细观察B树,我们可以看到
    • 1个节点可以存储超过2个元素,可以拥有超过2个子节点
    • 拥有二叉树的一些性质
    • 平衡;每个节点的所有子树高度一致
    • 比较矮

image-20210328181004879

2、m阶B树的性质(m>=2)

  • 假设一个节点存储的元素个数为x

    • 根节点:1<=x<=m - 1

    • 非根节点┌m/2┐ - 1 <= x <= m - 1

    • 如果有子节点,子节点个数为y = x + 1

      • 根节点:2 <= y <= m

      • 非根节点:┌m / 2┐ <= y <= m

        比如m = 3, 2 <= y <= 3,因此可以称为(2,3)树、2-3树

        比如m = 4, 2 <= y <= 4,因此可以称为(2,4)树、2-3-4树

        比如m = 5, 3 <= y <= 5,因此可以称为(3,5)树

        比如m = 6, 3 <= y <= 6,因此可以称为(3,6)树

        比如m = 7, 4 <= y <= 7,因此可以称为(4,7)树

如下图所示:

​ 根节点的范围就是1<=x<=m - 1,由于下面这是个4阶B树,所以x的取值范围就应该是1<=x<=3,也就是它存储元素的范围就是1~3

​ 非根节点┌m/2┐ - 1 <= x <= m - 1,这个的意思是对m/2进行向上取整,然后再-1,所以取值范围就是1 <= x <= 3,也就是它存储元素的范围就是1~3

​ 如果一个节点存储的元素个数为x,那么它的子节点的个数就是x + 1,如图所示,我们明显看到节点40的子节点个数就是2

image-20210328182337044

3、B树、二叉搜索树

  • B树和二叉搜索树,在逻辑上是等价的
  • 多代节点合并,可以获得一个超级节点
    • 2代合并的超级节点,最多拥有4个节点(至少是4阶B树)
    • 3代合并的超级节点,最多拥有8个节点(至少是8阶B树)
    • n代合并的超级节点,最多拥有2^n个节点(至少是4阶B树)

4、搜索

  • 跟二叉搜索树的搜索类似
  1. 先在节点内部从小到大开始搜索元素
  2. 如果命中,搜索结束
  3. 如果未命中,再去对应的子节点中搜索元素,重复步骤1

image-20210328183200804

假如我们要搜索的元素是50,那么我们就要找根节点40的右子树,然后元素50小于60,所以要找60的左子树上的元素,然后找到50

5、添加

  • 新添加的元素必定是添加到叶子节点

    如图所示,我们要在树中添加一个元素,我们肯定是要添加的树的叶子节点中的

    image-20210328184151609

  • 插入55

    如果插入55,我们首先比较55是大于根节点40的,所以我们55应该是在40的右子树上,然后55小于60,所以应该插到60的左子树上,55大于50,又因为,这棵树是4阶B树,非根节点存储的元素范围是:┌m/2┐ - 1 <= x <= m - 1,也就是1~3,所以直接将55插入到元素50的后面,如下图:

    image-20210328184217012

  • 插入95

    插入95的步骤和上面插入55的步骤相同,如下图:

    image-20210328184245501

  • 再插入98呢?

    但是,当我们往树中插入98之后,因为我们刚刚计算过,非根节点存储的元素范围是1~3,所以当我们要插入一个98的时候,很明显就会出现错误,也就是:

    • 最右下角的叶子节点的元素个数将超过限制
    • 这种现象可以称之为:上溢(overflow)

5.1、添加——上溢的解决

  • 上溢节点的元素个数必然等于m
  • 假设上溢节点最中间元素的位置为k
    • 将k位置的元素向上与父节点合并
    • 将[0,k - 1]和[k + 1,m - 1]位置的元素分裂成2个字节点
      • 这2个子节点的元素个数,必然都不会低于最低限制(┌m/2┐ - 1)
  • 一次分裂完毕后,有可能导致父节点上溢,依然按照上述方法解决
    • 最极端的情况,可能一直分裂到根节点

下面我们举一个列子进行说明:

image-20210328184818973

插入98

image-20210328184851534

插入52

image-20210328184912061

插入54

image-20210328184928740

我们可以很清楚的看到,当我们要插入98的时候,我们右下角节点已经满了,所以我们选取这个节点的中间节点,也就是95,记录它的位置为k,然后我们将95和它的父节点进行合并,然后将[0,k - 1]和[k + 1,m - 1]位置的元素分裂成2个字节点,后面的一次类推,我就不一一赘述了。

6、删除——叶子节点

  • 假如需要删除的元素在叶子节点中,那么直接删除即可

    image-20210328185316073
  • 删除30

    image-20210328185344495

6.1、删除——非叶子节点

  • 假如需要删除的元素在非叶子节点中

    1. 先找到前驱或者后驱元素,覆盖所需删除元素的值
    2. 再把前驱或后继元素删除
  • 删除60

    image-20210328185609615

    • 非叶子节点的前驱或后继元素,必定在叶子节点中
    • 真正的删除元素都是发生在叶子节点中

6.1.1、删除——下溢

image-20210328185714350

假如,这是一颗5阶B树,我说的是假如,当我们要去删除22元素的时候,我们知道5阶元素,其非根节点的存储范围是┌m/2┐ - 1 <= x <= m - 1,也就是2 <= x <= 4,所以删除22节点之后,很明显就发生了错误

这种现象称为:下溢(underflow)

6.1.2、删除——下溢的解决

  • 下溢节点的元素数量必然等于┌m/2┐ - 2,因为非根节点的存储范围是┌m/2┐ - 1 <= x <= m - 1
  • 如果将下溢节点临近的兄弟节点,有至少┌m/2┐,可以向其借一个元素,因为储存元素的范围是┌m/2┐ - 1 <= x <= m - 1,所以它至少有┌m/2┐个节点,才能有多余的借给它的兄弟节点
    • 将父节点的元素 b 插入到下溢节点的 0 位置(最小位置)
    • 用兄弟节点的元素 a(最大的元素)替代父节点的元素 b
    • 这种操作其实就是:旋转

Snipaste_2021-03-28_17-36-04

  • 如果下溢节点临近的兄弟节点,只有 ┌ m/2 ┐ − 1 个元素
    • 将父节点的元素 b 挪下来跟左右子节点进行合并
    • 合并后的节点元素个数等于┌ m/2 ┐ + ┌ m/2 ┐ − 2,不超过 m − 1
    • 这个操作可能会导致父节点下溢,依然按照上述方法解决,下溢现象可能会一直往上传播

image-20210328190931191

posted @ 2021-03-28 19:11  codeFiler  阅读(118)  评论(0编辑  收藏  举报