B树和B+树

B树（balance tree）和B+树，可以认为是N叉多路平衡排序查找树。

　　这里的N是相对于二叉树中的二来说的，B树和B+树的典型应用场景是数据库引擎的索引结构。但是从理论上讲，二叉树查找速度和比较次数都是最小的，为什么不用二叉树呢？

　　因为我们要考虑磁盘IO的影响，它相对于内存来说是很慢的。数据库索引是存储在磁盘上的，当数据量大时，就不能把整个索引全部加载到内存了，只能逐一加载每一个磁盘页（对应索引树的节点）。所以我们要减少IO次数，对于树来说，IO次数就是树的高度，而“矮胖”就是b树的特征之一，它的每个节点最多包含N个孩子，N称为b树的阶，N的大小取决于磁盘页的大小。

一个N阶的B树具有如下几个特征（括号内我给出了通俗的翻译）：

定义任意非叶子结点最多只有N个儿子，且N>2（翻译：一个节点最多分N个叉，最少2个叉）；
除根结点以外的非叶子结点的儿子数为[N/2, N]，向上取整（翻译：进一步限定了非根节点的分叉数目的最小值为N/2，为了防止形成二叉树）；
非叶子结点的关键字个数=儿子数-1 （翻译：限定子节点中的数据量，数量为分叉数-1）；
所有叶子结点位于同一层（翻译：废话）；
k个关键字把节点拆成k+1段，分别指向k+1个儿子，满足查找树的大小关系（翻译：同一级节点元素有序排列且左子<父<右子）。

简化总结：

　　N阶B树根节点最少2个儿子节点；
　　非子节点儿子节点数目最少为N/2，最多为N；
　　儿子节点的key数量最多为N-1；
　　同一级节点元素有序排列且左子<父<右子

如图是一个3阶段B树，顺便说明一下数字5的查询过程：

　　第一次磁盘IO，把9所在节点读到内存，把目标数5和9比较，小，找小于9对应的左节点；

　　第二次磁盘IO，还是读节点到内存，在内存中把5依次和2、6比较，定位到2、6中间区域对应的节点；

　　第三次侧排IO，读取key3、5所在的节点，并成功查询到5

　　b树的插入删除元素操作：
　　比如我们要在下图中插入元素4：

1，首先自顶向下查询找到4应该在的位置，即3、5之间；
2，但是3阶b树的节点最多只能有2个元素，所以把3、4、5里面的中间元素4上移（中间元素上移是插入操作的关键）；
3，上一层节点加入4之后也超载了，继续中间元素上移的操作，现在根节点变成了4、9；
4，还要满足查找树的性质，所以对元素进行调整以满足大小关系，始终维持多路平衡也是b树的优势，最后变成这样：