B+树和B-树回顾

B树：二叉搜索树

性质：

1.所有非叶子结点至多拥有两个儿子（Left和Right）；
2.所有结点存储一个关键字；
3.非叶子结点的左指针指向小于其关键字的子树，右指针指向大于其关键字的子树；

//往二叉查找树中插入结点  
//插入的话，可能要改变根结点的地址，所以传的是二级指针  
void inseart(PNode * root,KeyType key)  
{  
    //初始化插入结点  
    PNode p=(PNode)malloc(sizeof(Node));  
    p->key=key;  
    p->left=p->right=p->parent=NULL;  
    //空树时，直接作为根结点  
    if((*root)==NULL){  
        *root=p;  
        return;  
    }  
    //插入到当前结点（*root）的左孩子  
    if((*root)->left == NULL && (*root)->key > key){  
        p->parent=(*root);  
        (*root)->left=p;  
        return;  
    }  
    //插入到当前结点（*root）的右孩子  
    if((*root)->right == NULL && (*root)->key < key){  
        p->parent=(*root);  
        (*root)->right=p;  
        return;  
    }  
    if((*root)->key > key)  
        inseart(&(*root)->left,key);  
    else if((*root)->key < key)  
        inseart(&(*root)->right,key);  
    else  
        return;  
}  
  
//查找元素,找到返回关键字的结点指针，没找到返回NULL  
PNode search(PNode root,KeyType key)  
{  
    if(root == NULL)  
        return NULL;  
    if(key > root->key) //查找右子树  
        return search(root->right,key);  
    else if(key < root->key) //查找左子树  
        return search(root->left,key);  
    else  
        return root;  
}  
  
//查找最小关键字,空树时返回NULL  
PNode searchMin(PNode root)  
{  
    if(root == NULL)  
        return NULL;  
    if(root->left == NULL)  
        return root;  
    else  //一直往左孩子找，直到没有左孩子的结点  
        return searchMin(root->left);  
}  
  
//查找最大关键字,空树时返回NULL  
PNode searchMax(PNode root)  
{  
    if(root == NULL)  
        return NULL;  
    if(root->right == NULL)  
        return root;  
    else  //一直往右孩子找，直到没有右孩子的结点  
        return searchMax(root->right);  
}  
  
//查找某个结点的前驱  
PNode searchPredecessor(PNode p)  
{  
    //空树  
    if(p==NULL)  
        return p;  
    //有左子树、左子树中最大的那个  
    if(p->left)  
        return searchMax(p->left);  
    //无左子树,查找某个结点的右子树遍历完了  
    else{  
        if(p->parent == NULL)  
            return NULL;  
        //向上寻找前驱  
        while(p){  
            if(p->parent->right == p)  
                break;  
            p=p->parent;  
        }  
        return p->parent;  
    }  
}  
  
//查找某个结点的后继  
PNode searchSuccessor(PNode p)  
{  
    //空树  
    if(p==NULL)  
        return p;  
    //有右子树、右子树中最小的那个  
    if(p->right)  
        return searchMin(p->right);  
    //无右子树,查找某个结点的左子树遍历完了  
    else{  
        if(p->parent == NULL)  
            return NULL;  
        //向上寻找后继  
        while(p){  
            if(p->parent->left == p)  
                break;  
            p=p->parent;  
        }  
        return p->parent;  
    }  
}  
  
//根据关键字删除某个结点,删除成功返回1,否则返回0  
//如果把根结点删掉，那么要改变根结点的地址，所以传二级指针  
int deleteNode(PNode* root,KeyType key)  
{  
    PNode q;  
    //查找到要删除的结点  
    PNode p=search(*root,key);  
    KeyType temp;    //暂存后继结点的值  
    //没查到此关键字  
    if(!p)  
        return 0;  
    //1.被删结点是叶子结点，直接删除  
    if(p->left == NULL && p->right == NULL){  
        //只有一个元素，删完之后变成一颗空树  
        if(p->parent == NULL){  
            free(p);  
            (*root)=NULL;  
        }else{  
            //删除的结点是父节点的左孩子  
            if(p->parent->left == p)  
                p->parent->left=NULL;  
            else  //删除的结点是父节点的右孩子  
                p->parent->right=NULL;  
            free(p);  
        }  
    }  
  
    //2.被删结点只有左子树  
    else if(p->left && !(p->right)){  
        p->left->parent=p->parent;  
        //如果删除是父结点，要改变父节点指针  
        if(p->parent == NULL)  
            *root=p->left;  
        //删除的结点是父节点的左孩子  
        else if(p->parent->left == p)  
            p->parent->left=p->left;  
        else //删除的结点是父节点的右孩子  
            p->parent->right=p->left;  
        free(p);  
    }  
    //3.被删结点只有右孩子  
    else if(p->right && !(p->left)){  
        p->right->parent=p->parent;  
        //如果删除是父结点，要改变父节点指针  
        if(p->parent == NULL)  
            *root=p->right;  
        //删除的结点是父节点的左孩子  
        else if(p->parent->left == p)  
            p->parent->left=p->right;  
        else //删除的结点是父节点的右孩子  
            p->parent->right=p->right;  
        free(p);  
    }  
    //4.被删除的结点既有左孩子，又有右孩子  
    //该结点的后继结点肯定无左子树(参考上面查找后继结点函数)  
    //删掉后继结点,后继结点的值代替该结点  
    else{  
        //找到要删除结点的后继  
        q=searchSuccessor(p);  
        temp=q->key;  
        //删除后继结点  
        deleteNode(root,q->key);  
        p->key=temp;  
    }  
    return 1;  
}  
  
//创建一棵二叉查找树  
void create(PNode* root,KeyType *keyArray,int length)  
{  
    int i;  
    //逐个结点插入二叉树中  
    for(i=0;i<length;i++)  
        inseart(root,keyArray[i]);  
}

　　B-树：

1.定义任意非叶子结点最多只有M个儿子；且M>2；
2.根结点的儿子数为[2, M]；
3.除根结点以外的非叶子结点的儿子数为[M/2, M]；
4.每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
5.非叶子结点的关键字个数=指向儿子的指针个数-1；
6.非叶子结点的关键字：K[1], K[2], …, K[M-1]；且K[i] < K[i+1]；
7.非叶子结点的指针：P[1], P[2], …, P[M]；其中P[1]指向关键字小于K[1]的子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1], K[i])的子树；
8.所有叶子结点位于同一层；

typedef int KeyType ;
#define m 5
typedef struct Node{
int keynum;
struct Node *parent;
KeyType key[m+1];
struct Node *ptr[m+1];
Record *recptr[m+1];
}NodeType;

typedef struct{
NodeType *pt;
int i;
int tag;
}Result;


Result SearchBTree(NodeType *t,KeyType kx)  
{   
      
    p=t;q=NULL;found=FALSE;i=0;   
    while(p&&!found)  
    {   n=p->keynum;i=Search(p,kx);            
        if(i>0&&p->key[i]= =kx) found=TRUE;   
        else {q=p;p=p->ptr[i];}  
    }  
    if(found) return (p,i,1);                 
    else return (q,i,0);                      
}

B- 树查找算法分析

从查找算法中可以看出，在B- 树中进行查找包含两种基本操作:

( 1) 在B- 树中查找结点；

( 2) 在结点中查找关键字。

由于B- 树通常存储在磁盘上，则前一查找操作是在磁盘上进行的，而后一查找操作是在内存中进行的，即在磁盘上找到指针p 所指结点后，先将结点中的信息读入内存，然后再利用顺序查找或折半查找查询等于K 的关键字。显然，在磁盘上进行一次查找比在内存中进行一次查找的时间消耗多得多.

因此，在磁盘上进行查找的次数、即待查找关键字所在结点在B- 树上的层次树，是决定B树查找效率的首要因素

那么，对含有n 个关键码的m 阶B-树，最坏情况下达到多深呢？可按二叉平衡树进行类似分析。首先，讨论m 阶B-数各层上的最少结点数。

由B树定义：B树包含n个关键字。因此有n+1个树叶都在第J+1 层。

1）第一层为根，至少一个结点，根至少有两个孩子，因此在第二层至少有两个结点。

2）除根和树叶外，其它结点至少有[m/2]个孩子,因此第三层至少有2*[m/2]个结点,在第四层至少有2*[m/2]2 个结点…

3）那么在第J+1层至少有2*[m/2]J-1个结点,而J+1层的结点为叶子结点,于是叶子结点的个数n+1。有：

也就是说在n个关键字的B树查找，从根节点到关键字所在的节点所涉及的节点数不超过：

B+树

B+树是B-树的变体，也是一种多路搜索树：

1.其定义基本与B-树同，除了：

2.非叶子结点的子树指针与关键字个数相同；

3.非叶子结点的子树指针P[i]，指向关键字值属于[K[i], K[i+1])的子树

（B-树是开区间）；

5.为所有叶子结点增加一个链指针；

6.所有关键字都在叶子结点出现；

B+的特性：

1.所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好

是有序的；

2.不可能在非叶子结点命中；

3.非叶子结点相当于是叶子结点的索引（稀疏索引），叶子结点相当于是存储

（关键字）数据的数据层；

4.更适合文件索引系统；

相关详细讲解：http://blog.sina.com.cn/s/blog_4e0c21cc01010itp.html

posted @ 2017-07-10 03:56 never_comparison 阅读(140) 评论(0) 收藏举报

刷新页面返回顶部

B+树和B-树回顾

公告