C基础 - 终结 Size Balanced Tree

引言 - 初识 Size Balanced Tree

  最近在抽细碎的时间看和学习 random 的 randnet 小型网络库.

  iamrandom/randnet - https://github.com/iamrandom/randnet (1)

  了解到 陈启峰 2006-12-29 高中的时候写的论文 Size Balanced Tree(一种变种的 AVI 树) 感觉好精彩.

  就着手翻译成实战代码.

  陈启峰 Size Balanced Tree - https://files.cnblogs.com/files/life2refuel/%E9%99%88%E5%90%AF%E5%B3%B0%E3%80%8ASize-Balanced-Tree%E3%80%8B.pdf (2)

     翻译过程中前驱和后继参照了下面同行的代码

   二叉查找树的前驱后继 - http://www.cnblogs.com/Renyi-Fan/p/8252227.html (3)

: )  - , -

  推荐朋友学习的时候, 可以先看 (2) 和 (3) . 其中 (3) 最简单, 看完之后应该收获满满.

对于 (2) 还是深深佩服的, 毕竟一样大时候, 才刚脱离趣味玩泥巴. 大佬就可以证明算法的完备性.  如果你看到

(2) 证明部分,  这里不妨补充一些关于 f[h] 求证过程.

其实也就是高中二阶等比数列求证.

  那后面就开始扯了正题了  : ) 如何用 C 实现上面论文思路, 用于实战开发中.. 我这里抛砖砸高铁.  -:

 

前言 - 结构接口先行

  先看设计的数据结构 

#ifndef _H_STREE
#define _H_STREE

typedef unsigned long long stree_key_t;

typedef union {
    void * ptr;
    double number;
    signed long long i;
    unsigned long long u;
} stree_value_t;

struct stree {
    struct stree * left;    // 左子树
    struct stree * right;   // 右子树
    unsigned size;          // 树节点个数

    stree_key_t key;        // tree node key
    stree_value_t value;    // tree node value
};

typedef struct stree * stree_t;

inline unsigned stree_size(const struct stree * const node) {
    return node ? node->size : 0;
}

#endif//_H_STREE

Size Balanced Tree 中多了一个特色节点 unsigned size; 用户记录当前树上节点个数.  相比 red black tree

后者多记录了 父亲节点和红黑性质. 每种平衡搜索树, 都有自己的特殊字段. 看的出后续核心操作都是

围绕 unsigend size; 字段.

(对于 key 和 value 设计持开放态度. 其中 key 是必须的, 不过这里直接 unsigned long long 走起了)

首先看看最好理解的旋转部分(出道就是巅峰), 的 rotate 旋转操作

// stree_left_rotate - size tree left rotate
static void stree_left_rotate(stree_t * pode) {
    stree_t node = *pode;
    stree_t right = node->right;

    node->right = right->left;
    right->left = node;
    right->size = node->size;
    node->size = stree_size(node->left) + stree_size(node->right) + 1;

    *pode = right;
}

// stree_right_rotate - size tree right rotate
//
//           (y)   left rotate      (x)
//          /   \  ------------>   /   \
//        (x)   [C]              [A]   (y)
//       /   \     <------------      /   \
//      [A]  [B]    right rotate    [B]   [C]
//
static void stree_right_rotate(stree_t * pode) {
    stree_t node = *pode;
    stree_t left = node->left;

    node->left = left->right;
    left->right = node;
    left->size = node->size;
    node->size = stree_size(node->left) + stree_size(node->right) + 1;

    *pode = left;
}

强烈好好看看练习练习, 否则后面更加不懂.

  : ) 好想说, 后面不用看了, 复制我的代码. 如果用的时候用吧, 否则就别再见了.

 

正文 - 有时候要认命

当前核心是翻译论文, 并且终结 Size Balanced Tree 各种花式的代码.

细节部分看论文, 看作者原文思路.这里只是贴代码, 带你感受一下一个上的了台面的 Size Balanced Tree 实现  ~

stree.h

#ifndef _H_STREE
#define _H_STREE

typedef unsigned long long stree_key_t;

typedef union {
    void * ptr;
    double number;
    signed long long i;
    unsigned long long u;
} stree_value_t;

struct stree {
    struct stree * left;    // 左子树
    struct stree * right;   // 右子树
    unsigned size;          // 树节点个数

    stree_key_t key;        // tree node key
    stree_value_t value;    // tree node value
};

typedef struct stree * stree_t;

inline unsigned stree_size(const struct stree * const node) {
    return node ? node->size : 0;
}

//
// stree_delete - Size Balanced Tree delete destroy 
// poot     : 指向 tree 对象指针
// return   : void
//
extern void stree_delete(stree_t * poot);

//
// stree_insert - size tree insert node
// poot     : 指向 tree 对象指针
// key      : 插入 node key
// value    : 插入 node value
// return   : void
//
extern void stree_insert(stree_t * poot, stree_key_t key, stree_value_t value);

//
// stree_remove - size tree remove node
// poot     : 指向 tree 对象指针
// key      : 查找 node key
// return   : void
//
extern void stree_remove(stree_t * poot, stree_key_t key);

//
// stree_find - 寻找到指定的节点
// root     : tree 对象
// key      : 查找 node key
// return   : 查找 tree node, NULL 表示没有
//
extern stree_t stree_find(stree_t root, stree_key_t key);

//
// stree_rank - 返回 key 在 root 树中排名, 也就是比 key 小的那颗树的大小上加 1
// root     : tree 对象
// key      : 查找 node key
// return   : 排名
// 
extern unsigned stree_rank(stree_t root, stree_key_t key);

//
// stree_select - root 根节点树种排名为 k 的节点
// root     : tree 对象
// k        : 排名 [1, stree_size(root)]
// return   : 返回查询到节点
//
extern stree_t stree_select(stree_t root, unsigned k);

//
// stree_pred - 查找 root 前驱节点, 比 key 小的最大的数
// root     : tree 对象
// key      : 查找 node key
// return   : 返回查询到节点
//
extern stree_t stree_pred(stree_t root, stree_key_t key);

//
// stree_succ - 查找 root 后继节点, 比 key 大的最小的数
// root     : tree 对象
// key      : 查找 node key
// return   : 返回查询到节点
//
extern stree_t stree_succ(stree_t root, stree_key_t key);

#endif//_H_STREE

  上面 delete 和 remove 单词和论文中比对有些不一样. 因为在 C / C++ 中 delete 语义是销毁. 

所以采用 remove 去除的节点的语义单词. 应该更加贴合实际开发的代码函数定义. 

stree.c

#include "stree.h"
#include <stdlib.h>
#include <stdbool.h>

static void stree_free(stree_t root) {
    if (root->left)
        stree_free(root->left);
    if (root->right)
        stree_free(root->right);
    free(root);
}

//
// stree_delete - Size Balanced Tree delete destroy 
// poot     : 指向 tree 对象指针
// return   : void
//
inline void 
stree_delete(stree_t * poot) {
    if (!poot || !*poot)
        return;
    stree_free(*poot);
    *poot = NULL;
}

// stree_left_rotate - size tree left rotate
static void stree_left_rotate(stree_t * pode) {
    stree_t node = *pode;
    stree_t right = node->right;

    node->right = right->left;
    right->left = node;
    right->size = node->size;
    node->size = stree_size(node->left) + stree_size(node->right) + 1;

    *pode = right;
}

// stree_right_rotate - size tree right rotate
//
//           (y)   left rotate      (x)
//          /   \  ------------>   /   \
//        (x)   [C]              [A]   (y)
//       /   \     <------------      /   \
//      [A]  [B]    right rotate    [B]   [C]
//
static void stree_right_rotate(stree_t * pode) {
    stree_t node = *pode;
    stree_t left = node->left;

    node->left = left->right;
    left->right = node;
    left->size = node->size;
    node->size = stree_size(node->left) + stree_size(node->right) + 1;

    *pode = left;
}

// stree_maintain - Size Balanced Tree Maintain
static void stree_maintain(stree_t * pode, bool flag) {
    unsigned size;
    stree_t node = *pode;
    if (!node) return;

    if (!flag) {
        if (!node->left) return;

        size = stree_size(node->right);
        if (size < stree_size(node->left->left))
            stree_right_rotate(pode);
        else if (size < stree_size(node->left->right)) {
            stree_left_rotate(&node->left);
            stree_right_rotate(pode);
        } else return;

        stree_maintain(&node->left, false);
    } else {
        if (!node->right) return;

        size = stree_size(node->left);
        if (size < stree_size(node->right->right))
            stree_left_rotate(pode);
        else if (size < stree_size(node->right->left)) {
            stree_right_rotate(&node->right);
            stree_left_rotate(pode);
        } else return;

        stree_maintain(&node->right, true);
    }

    stree_maintain(pode, false);
    stree_maintain(pode, true);
}

static void stree_insert_node(stree_t * poot, stree_t node) {
    bool flag;
    stree_t root = *poot;
    if (!root) {
        (*poot = node)->size = 1;
        return;
    }

    ++root->size; // 插入到非空树, 节点数加 1
    if ((flag = node->key < root->key))
        stree_insert_node(&root->left, node);
    else
        stree_insert_node(&root->right, node);
    stree_maintain(poot, !flag);
}

//
// stree_insert - size tree insert node
// poot     : 指向 tree 对象指针
// key      : 插入 node key
// value    : 插入 node value
// return   : void
//
inline void 
stree_insert(stree_t * poot, stree_key_t key, stree_value_t value) {
    stree_t node = calloc(1, sizeof(struct stree));
    node->key = key;
    node->value = value;
    stree_insert_node(poot, node);
}

static stree_t stree_remove_node(stree_t * pode, const stree_key_t key, bool find) {
    stree_t record;
    stree_t node = *pode;
    if (!node) return NULL;

    if (find && !node->right) {
        //  the right end node of right child tree replace the delete node
        *pode = node->left;
        return node;
    }

    if (!find && key == node->key) {
        if (node->size == 1) {
            // leaf node, need delete
            *pode = NULL;
            return node;
        }
        if (node->size == 2) {
            // single branch node, need child node replace delete node
            record = node->left ? node->left : node->right;
            node->left = node->right = NULL;
        } else {
            // max key node of left tree replace pnode
            record = stree_remove_node(&node->left, key, true);
        }
        if (record) {
            node->key = record->key;
            node->value = record->value;
        }
        --node->size;
        stree_maintain(pode, true);
    } else if (!find && key < node->key) {
        record = stree_remove_node(&node->left, key, false);
        if (record)
            --node->size;
    } else {
        record = stree_remove_node(&node->right, key, find);
        if (record)
            --node->size;
    }

    stree_maintain(pode, !find && key < node->key);
    return record;
}

//
// stree_remove - size tree remove node
// poot     : 指向 tree 对象指针
// key      : 查找 node key
// return   : void
//
inline void 
stree_remove(stree_t * poot, stree_key_t key) {
    stree_t node;
    if (!poot) return;
    node = stree_remove_node(poot, key, false);
    if (node) free(node);
}

//
// stree_find - 寻找到指定的节点
// root     : tree 对象
// key      : 查找 node key
// return   : 查找 tree node, NULL 表示没有
//
stree_t 
stree_find(stree_t root, stree_key_t key) {
    while (root) {
        if (key < root->key)
            root = root->left;
        else if (root->key < key)
            root = root->right;
        else break;
    }
    return root;
}

//
// stree_rank - 返回 key 在 root 树中排名, 也就是比 key 小的那颗树的大小上加 1
// root     : tree 对象
// key      : 查找 node key
// return   : 排名
// 
unsigned 
stree_rank(stree_t root, stree_key_t key) {
    int k = 0;
    while (root) {
        if (key < root->key)
            root = root->left;
        else if (root->key < key) {
            k += stree_size(root->left) + 1;
            root = root->right;
        } else {
            k += stree_size(root->left);
            break;
        }
    }
    return k;
}

//
// stree_select - root 根节点树种排名为 k 的节点
// root     : tree 对象
// k        : 排名 [1, stree_size(root)]
// return   : 返回查询到节点
//
stree_t 
stree_select(stree_t root, unsigned k) {
    while (root) {
        unsigned size = stree_size(root->left);
        if (k < size)
            root = root->left;
        else if (size < k) {
            root = root->right;
            k -= size + 1;
        } else break;
    }
    return root;
}

/*
 前驱节点
    1. 若一个节点有左子树,那么该节点的前驱节点是其左子树中 key 值最大的节点
    2. 若一个节点没有左子树,那么判断该节点和其父节点的关系
        2.1 若该节点是其父节点的右孩子,那么该节点的前驱节点即为其父节点。
        2.2 若该节点是其父节点的左孩子,那么需要沿着其父亲节点一直向树的顶端寻找,
            直到找到一个节点P,P节点是其父节点Q的右孩子,那么Q就是该节点的后继节点

 */

static stree_t stree_get_right(stree_t root) {
    if (root) {
        while (root->right)
            root = root->right;
    }
    return root;
}

static stree_t stree_get_right_p(stree_t root, stree_key_t key, stree_t * pq, stree_t * pr) {
    while (root) {
        if (key == root->key)
            return root;

        *pq = root;
        if (key < root->key)
            root = root->left;
        else {
            *pr = root; // 出现右拐点, 父节点 Q 的右孩子
            root = root->right;
        }
    }
    return root;
}

//
// stree_pred - 查找 root 前驱节点, 比 key 小的最大的数
// root     : tree 对象
// key      : 查找 node key
// return   : 返回查询到节点
//
stree_t 
stree_pred(stree_t root, stree_key_t key) {
    if (root) {
        stree_t q = NULL, r = NULL;
        stree_t p = stree_get_right_p(root, key, &q, &r);
        if (!p)
            return NULL;
        // 有左子树
        if (p->left)
            return stree_get_right(p->right);

        // 没有前驱节点的情况
        if ((!p) || (p && !r))
            return NULL;

        // 没有左子树, 其父节点的右节点
        if (p == q->right)
            return q;
        // 没有左子树, 是其父节点的左节点
        return r;
    }
    return root;
}

/*
 后继节点
    1. 若一个节点有右子树,那么该节点的后继节点是其右子树中 key 值最小的节点
    2. 若一个节点没有右子树,那么判断该节点和其父节点的关系 
        2.1 若该节点是其父节点的左孩子,那么该节点的后继结点即为其父节点 
        2.2 若该节点是其父节点的右孩子,那么需要沿着其父亲节点一直向树的顶端寻找,
            直到找到一个节点P,P节点是其父节点Q的左孩子,那么Q就是该节点的后继节点
 */

static stree_t stree_get_left(stree_t root) {
    if (root) {
        while (root->left)
            root = root->left;
    }
    return root;
}

static stree_t stree_get_left_p(stree_t root, stree_key_t key, stree_t * pq, stree_t * pr) {
    while (root) {
        if (root->key == key)
            return root;

        *pq = root; // 设置父亲节点
        if (root->key < key)
            root = root->right;
        else {
            *pr = root; // 出现左拐点, 父节点 Q 的左孩子
            root = root->left;
        }
    }
    return root;
}

//
// stree_succ - 查找 root 后继节点, 比 key 大的最小的数
// root     : tree 对象
// key      : 查找 node key
// return   : 返回查询到节点
//
stree_t 
stree_succ(stree_t root, stree_key_t key) {
    if (root) {
        stree_t q = NULL, r = NULL;
        stree_t p = stree_get_left_p(root, key, &q, &r);
        if (!p)
            return NULL;
        // 有右子树
        if (p->right)
            return stree_get_right(p->right);

        // 没有前驱节点的情况
        if ((!p) || (p && !r))
            return NULL;

        // 没有右子树, 其父节点的左节点
        if (p == q->left)
            return q;
        // 没有右子树, 是其父节点的右节点
        return r;
    }
    return root;
}

   这里也简单写个测试例子, 保证核心逻辑插入和查找还有销毁可以用. 

main.c

#include <stdio.h>
#include <stdlib.h>

#include "stree.h"

//
// Size Balanced Tree
//
int main(int argc, char * argv[]) {
    stree_t root = NULL;

    // 插入数据
    for (int i = 0; i < 9; i++)
        stree_insert(&root, i, (stree_value_t) { .i = i });
    
    int key = 6;
    stree_t node = stree_find(root, key);
    if (NULL == node) {
        fprintf(stderr, "stree_find is error key = %d\n", key);
        exit(EXIT_FAILURE);
    }
    printf("key = %d, node = %lld\n", key, node->value.i);
    
    stree_remove(&root, key);
    node = stree_find(root, key);
    if (node) {
        fprintf(stderr, "stree_find is error key = %d\n", key);
        exit(EXIT_FAILURE);
    }
    printf("stree_remove is success key = %d\n", key);

    stree_delete(&root);
    return 0;
}

论文 + C 代码互相配合, 希望能对准备尝试的人有些作用.  长舒一口气.

抛开图, 面试最难不过二叉树 ~,~

开发中 tree set hash list vector 非常常见, 其中 tree 常被 hash 和 set 抢掉运用场景.  例如 id 管理.

但二叉树是批量搜索业务的基石 (别说跳表). 不管如何你都得尝试跃迁过 ~-~

 

后记 - 开心就好

  错误是难免的, 欢迎交流指正, 互相提升 ~

  負け犬達のレクイエム - http://music.163.com/m/song?id=29751658&userid=16529894

 

: )

 故事的开头,总是惊鸿一瞥,一眼千年,故事的结尾,总是潇洒转身,渐行渐远

-:

 

posted on 2018-08-12 20:52  喜欢兰花山丘  阅读(640)  评论(0编辑  收藏  举报