BST B树 B+树

二叉排序树/二叉搜索树 (BST)

定义
  • 左子树节点值<根节点值<右子树节点值

  • 默认不允许两个节点的关键值相同

进行中序遍历可以得到递增的有序序列

查找效率

取决与树的高度,最好O(log n),最坏O( n )

平衡二叉树(AVL)

定义
  • 它必须是二叉查找树。
  • 每个节点的左子树和右子树的高度差至多为1。

B树(多路平衡查找树)

比较好的解释:https://www.cnblogs.com/lianzhilei/p/11250589.html

定义
  • B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示。一颗m阶B树或为空树,或为满足如下特性的m叉树:

  • 树中每个结点至多有m棵子树,至多含有m-1个关键字

  • 若根结点不是终端节点,则至少有两棵子树

  • 每个非叶子节点(除了根)具有至少⌈ m/2⌉(向上取整)子节点,即至少含有⌈ m/2⌉-1个关键字。

  • 所有的叶结点都出现在同一层次上,并且不带信息(高度一致)

B+树

类似二叉排序树 左<中<右

使用B树的好处

B树可以在内部节点同时存储键和值,因此,把频繁访问的数据放在靠近根节点的地方将会大大提高热点数据的查询效率。这种特性使得B树在特定数据重复多次查询的场景中更加高效。

使用B+树的好处

由于B+树的内部节点只存放键,不存放值,因此,一次读取,可以在内存页中获取更多的键,有利于更快地缩小查找范围。 B+树的叶节点由一条链相连,因此,当需要进行一次全数据遍历的时候,B+树只需要使用O(logN)时间找到最小的一个节点,然后通过链进行O(N)的顺序遍历即可。而B树则需要对树的每一层进行遍历,这会需要更多的内存置换次数,因此也就需要花费更多的时间

数据库为什么使用B+树而不是B树

B树只适合随机检索,而B+树同时支持随机检索和顺序检索;
B+树空间利用率更高,可减少I/O次数,磁盘读写代价更低。一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。这样的话,索引查找过程中就要产生磁盘I/O消耗。B+树的内部结点并没有指向关键字具体信息的指针,只是作为索引使用,其内部结点比B树小,盘块能容纳的结点中关键字数量更多,一次性读入内存中可以查找的关键字也就越多,相对的,IO读写次数也就降低了。而IO读写次数是影响索引检索效率的最大因素;
B+树的查询效率更加稳定。B树搜索有可能会在非叶子结点结束,越靠近根节点的记录查找时间越短,只要找到关键字即可确定记录的存在,其性能等价于在关键字全集内做一次二分查找。而在B+树中,顺序检索比较明显,随机检索时,任何关键字的查找都必须走一条从根节点到叶节点的路,所有关键字的查找路径长度相同,导致每一个关键字的查询效率相当。
B-树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。B+树的叶子节点使用指针顺序连接在一起,只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作。
增删文件(节点)时,效率更高。因为B+树的叶子节点包含所有关键字,并以有序的链表结构存储,这样可很好提高增删效率。

posted @ 2021-06-09 13:42  CJ-cooper  阅读(83)  评论(0编辑  收藏  举报