C 封装一个简单二叉树基库

引文

  今天分享一个喜欢佩服的伟人,应该算人类文明极大突破者.收藏过一张纸币类型如下

那我们继续科普一段关于他的简介

  '高斯有些孤傲,但令人惊奇的是,他春风得意地度过了中产阶级的一生,而 
没有遭受到冷酷现实的打击;这种打击常无情地加诸于每个脱离现实环境生活的 
人。或许高斯讲求实效和追求完美的性格,有助于让他抓住生活中的简单现实。 
高斯22岁获博士学位,25岁当选圣彼德堡科学院外籍院士,30岁任哥廷根大学数 
学教授兼天文台台长。虽说高斯不喜欢浮华荣耀,但在他成名后的五十年间,这 
些东西就像雨点似的落在他身上,几乎整个欧洲都卷入了这场授奖的风潮,他一 
生共获得75种形形色色的荣誉,包括1818年英王乔治三世赐封的“参议员”, 
1845年又被赐封为“首席参议员”。高斯的两次婚姻也都非常幸福,第一个妻子 
死于难产后,不到十个月,高斯又娶了第二个妻子。心理学和生理学上有一个常 
见的现象,婚姻生活过得幸福的人,常在丧偶之后很快再婚,
他的晚年不幸福,

孩子和他关系不好...'

  关于他的专业知识 业界评价如下

  '能从九霄云外的高度按照某种观点掌握星空和深奥数学的天才。'地球上搞数学人类中公认前三diao. 

有时候我们所有的一切 都是自己抉择的过程,

不是自己选择,就是别人选择. 很公平, 就看每个人觉醒的早晚,觉醒能力的 不同而已. 

 

推荐参照

    没有什么不同 http://music.163.com/#/song?id=25713024

再扯一点, '孤傲'的话题, 生活中有时候遇到一类人, 第一次见他觉得太傲了, 接触了一段时间

发现这人了不起, 后面了解多了, 还是很喜欢和他交朋友. 人不错.

  人是最复杂的,也是最容易改变的.关键需要多了解.

 

前言

   到这里逐渐切入正题了, 当一个构想 投入生产环境一般 需要下面几个步骤.

1算法/思路 构思

2算法实现 测试

3.封装基础算法结构库

4.算法/思路结构库 测试

5. 投入生产环境轻微重构

6.生产环境测试

7.实战检测.

  所以封装一个库还是有些流程比较耗时的. 我们这里分享的是关于一个二叉树基础库的分享. 原先花了2天使用红黑树实现,

但是最后磕磕碰碰,抄抄补补搞出来但是代码很不好维护,最后退而求其次采用 二叉查找树构造了一个基础库. 并测试了一下基本可以.

等下一次直接用到实战环境中.

  首选学习这个二叉树 库封装 需要

    1.了解二叉树基础原理

    2.了解C接口的简单设计

  能够学到

    1.C接口设计的一些技巧

    2.接口简单测试

首先看下面接口文档 tree.h

#ifndef _H_TREE
#define _H_TREE

//4.0 控制台打印错误信息, fmt必须是双引号括起来的宏
#ifndef CERR
#define CERR(fmt, ...) \
    fprintf(stderr,"[%s:%s:%d][error %d:%s]" fmt "\r\n",\
         __FILE__, __func__, __LINE__, errno, strerror(errno),##__VA_ARGS__)
#endif/* !CERR */

//4.1 控制台打印错误信息并退出, t同样fmt必须是 ""括起来的字符串常量
#ifndef CERR_EXIT
#define CERR_EXIT(fmt,...) \
    CERR(fmt,##__VA_ARGS__),exit(EXIT_FAILURE)
#endif/* !ERR */

/*
*  这里是简单二叉查找树封装的基库,封装库的库
*  需要用的的一些辅助结构,主要是通用结构和申请释放的函数指针
*/
typedef struct tree* tree_t;
typedef void* (*pnew_f)();
typedef void (*vdel_f)(void* node);
typedef int (*icmp_f)(void* ln, void* rn);


// __开头一般意思是不希望你使用,私有的,系统使用
struct __tnode {
    struct __tnode* lc;
    struct __tnode* rc;
};
/*
*   这个宏必须放在使用的结构体开头,如下
*  struct persion {
        _TREE_HEAD;
        char* name;
        int age;
        ...
*  }
*
*/
#define _TREE_HEAD \
    struct __tnode __tn


/*
* new   : 结点申请内存用的函数指针, 对映参数中是 特定结构体指针
* acmp  : 用于添加比较 
* gdcmp : 两个结点比较函数,用户查找和删除
* del   : 结点回收函数,第一个参数就是 二叉树中保存的结点地址
* ret   : 返回创建好的二叉树结构, 这里是 tree_t 结构
*/
tree_t tree_create(pnew_f new, icmp_f acmp, icmp_f gdcmp, vdel_f del);

/*
* proot  : 指向tree_t 根结点的指针,
* node     : 待处理的结点对象, 会调用new(node) 创建新结点
* ret    : proot 即是输入参数也是返回参数,返回根结点返回状况
*/
void tree_add(tree_t* proot, void* node);

/*
* proot  : 输入和输出参数,指向根结点的指针
* node   : 删除结点,这里会调用 cmp(node 左参数, foreach) 找见,通过del(find) 删除
*/
void tree_del(tree_t* proot, void* node);

/*
* root   : 根结点,查找的总对象
* node   : 查找条件,会通过cmp(node, foreach)去查找
* parent : 返回查找到的父亲结点
* ret     : 返回查找到的结点对象
*/
void* tree_get(tree_t root, void* node, void** parent);

/*
* proot  : 指向二叉树数结点指针
* 会调用 del(foreach) 去删除所有结点,并将所有还原到NULL
*/
void tree_destroy(tree_t* proot);

#endif // !_H_TREE

上面有些代码在实战环节是要去掉和统一修改的.这里是为了降低耦合性,方便测试,就放在一起了.

接口比较精简,还可以更精简,下次再优化.应该一看都明白上面代码是干什么的. 需要注意的是

在你想使用二叉树性质的 结构体中 需要在第一个 成员位置 加入

_TREE_NODE;

举例如下

//通用结构体变量
struct dict {
    _TREE_HEAD;
    char* key;
    char* value;
};

至于为什么,想一想也都明白了,这样的代码或者说技巧 太多了, Linux内核中结构喜欢 将其放在最末的位置,会有一个

typeof 宏 判断位置.那下面我们开始说说具体设计. 扯一点,一个需要C入门选手,要么把C语言之父的书看一遍,倒着看一遍.

写一遍或理解会用上面的结构体设计,基本C这块语法都明白了.

  一定要多写代码, 因为未来不清楚, 但可以知道的是不好好写代码, 那现在都不清楚了. 大家觉得呢.

 

正文

1.说细节实现 

  首先看创建函数定义,这里主要用到函数指针技巧,比较直白.

//内部使用的主要结构
struct tree {
    //保存二叉树的头结点
    struct __tnode* root;

    //构建,释放,删除操作的函数指针
    pnew_f new;
    icmp_f acmp;
    icmp_f gdcmp;
    vdel_f del;
};


/*
* new   : 结点申请内存用的函数指针, 对映参数中是 特定结构体指针
* acmp  : 用于添加比较
* gdcmp : 两个结点比较函数,用户查找和删除
* del   : 结点回收函数,第一个参数就是 二叉树中保存的结点地址
* ret   : 返回创建好的二叉树结构, 这里是 tree_t 结构
*/
tree_t 
tree_create(pnew_f new, icmp_f acmp, icmp_f gdcmp, vdel_f del)
{
    tree_t root = malloc(sizeof(struct tree));
    if (NULL == root)
        CERR_EXIT("malloc struct tree error!");

    //初始化挨个操作
    memset(root, 0, sizeof(struct tree));
    root->new = new;
    root->acmp = acmp;
    root->gdcmp = gdcmp;
    root->del = del;

    return root;
}

上面主要是需要注册4个函数, 第一个new自然是分配内存的操作返回void*就是构造好的内存, acmp是添加结点的时候比较函数,

gdcmp 是 get 和 del 时候需要调用的查找函数指针, 对于del可以没有这个时候,可以传入NULL,表示不需要帮忙回收内存.

大家可以仔细考虑一下为什么要这些. 

首先创建和销毁是必须的,后面 add的时候添加的是 node 结点, 而查找的时候是比较的是 关键字key结构是不一样的.

同样看一下回收函数

static void __tree_destroy(struct __tnode* root, vdel_f del)
{
    if (root) {
        __tree_destroy(root->lc, del);
        __tree_destroy(root->rc, del);
        del(root); //结点删除采用注册方法
    }
}

/*
 * proot  : 指向二叉树数结点指针
 * 会调用 del(foreach) 去删除所有结点,并将所有还原到NULL
 */
void 
tree_destroy(tree_t* proot)
{
    tree_t root;
    if ((!proot) || !(root = *proot))
        return;
    if (root->root && root->del)
        __tree_destroy(root->root, root->del);
    free(*proot); //单独释放最外层内容
    *proot = NULL;
}

比较质朴没有好解释的,最后会让释放的指针指向NULL.

后面就是二叉查找树插入查找和删除算法实现了,比较基础,对着书翻译就可以了.添加代码如下

/*
* proot  : 指向tree_t 根结点的指针,
* node      : 待处理的结点对象, 会调用new(node) 创建新结点
* ret    : proot 即是输入参数也是返回参数,返回根结点返回状况
*/
void 
tree_add(tree_t* proot, void* node)
{
    tree_t tm;
    struct __tnode *n, *p = NULL;
    icmp_f cmp;
    int tmp = 0;

    if ((!proot) || (!node) || !(tm = *proot)) //参数无效直接返回
        return;
    if (!(n = tm->root)) { //插入的结点为头结点,直接赋值返回
        tm->root = tm->new(node);
        return;
    }
    //下面开始找 待插入结点
    cmp = tm->acmp;
    while (n) {
        if ((tmp = cmp(node, n)) == 0) //这种情况是不允许插入的
            return;
        p = n;
        if (tmp < 0)
            n = n->lc;
        else
            n = n->rc;
    }

    //找见了开始插入结点
    if (tmp < 0)
        p->lc = tm->new(node);
    else
        p->rc = tm->new(node);
}

对于cmp

typedef int (*icmp_f)(void* ln, void* rn);

这里有点约定, ln == rn 返回0, ln>rn 返回 >0 反之返回<0. 其中 传入的基参数 .都是做第一个参数.

下一版本想改为

//int cmp(void* node, void* rn); 必须是这样格式
typedef int (*icmp_f)();

弱约束,可以用.毕竟底层库应该灵活,上层库应该写死. 这样在难处学习成本高,简单处学习成本低. 等同于红黑树的添加和查找.

后面还有一个删除代码

/*
* proot  : 输入和输出参数,指向根结点的指针
* node   : 删除结点,这里会调用 cmp(node 左参数, foreach) 找见,通过del(find) 删除
*/
void 
tree_del(tree_t* proot, void* node)
{
    tree_t tm;
    struct __tnode *n, *p, *t, *tp;
    if ((!proot) || (!node) || !(tm = *proot) || !(tm->root))
        return;
    //查找一下这个结点,如果不存在直接返回
    if (!(n = tree_get(tm, node, (void**)&p)))
        return;
    //第一种删除和操作
    if ((!n->lc || !n->rc) && !(t = n->lc)) 
            t = n->rc;
    else { //第二种情况,将右子树最小结点和当前删除结点交换
        for (tp = n, t = tp->rc; (t->lc); tp = t, t = t->lc)
            ; //找见了最小的左子树结点n 和父结点p
        if (tp->lc == t)
            tp->lc = t->rc;
        else
            tp->rc = t->rc;
        //移动孩子关系
        t->lc = n->lc;
        t->rc = n->rc;
    }

    if (!p) //设置新的root结点
        tm->root = t;
    else {
        if (p->lc == n) //调整父亲和孩子关系,需要你理解二叉查找树,否则那就相信我吧
            p->lc = t;
        else
            p->rc = t;
    }
    //这里释放那个结点
    if (tm->del)
        tm->del(n);
}

删除思路解释,单节点删除,父节点指向后继, 多结点找到右子树中最小的结点当做新结点,再删除它.上一个版本用尾递归,这里采用的是非递归实现.

对于查找是这样的,也会一起找到父节点

/*
* root   : 根结点,查找的总对象
* node   : 查找条件,会通过cmp(node, foreach)去查找
* parent : 返回查找到的父亲结点
* ret     : 返回查找到的结点对象
*/
void* 
tree_get(tree_t root, void* node, void** parent)
{
    struct __tnode *n, *p = NULL;
    icmp_f cmp;
    int tmp;

    if(parent) //初始化功能
        *parent = NULL;
    if ((!node) || (!root) || !(n = root->root))
        return NULL;
    //查找结点
    cmp = root->gdcmp;
    while (n) {
        if ((tmp = cmp(node, n)) == 0){ //这种情况是不允许插入的        
            //返回父亲结点,没有就置空
            if (parent)
                *parent = p;    
            break;
        }
        p = n;
        if (tmp < 0)
            n = n->lc;
        else
            n = n->rc;
    }

    return n;
}

特别是开头的

    if(parent) //初始化功能
        *parent = NULL;

为了是查找返回数据都是正常数据,没有意外.

到这里基本上二叉树基库就整理完毕了. 主要是一些C接口设计的技巧 + 二叉树查找树的简单算法.

还是比较直白的.下一个版本 将公有头文件内容移除去,会更简约一点.

 

2.tree.c 代码完整展示

  完整代码展示如下

#include "tree.h"
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>

//内部使用的主要结构
struct tree {
    //保存二叉树的头结点
    struct __tnode* root;

    //构建,释放,删除操作的函数指针
    pnew_f new;
    icmp_f acmp;
    icmp_f gdcmp;
    vdel_f del;
};


/*
* new   : 结点申请内存用的函数指针, 对映参数中是 特定结构体指针
* acmp  : 用于添加比较
* gdcmp : 两个结点比较函数,用户查找和删除
* del   : 结点回收函数,第一个参数就是 二叉树中保存的结点地址
* ret   : 返回创建好的二叉树结构, 这里是 tree_t 结构
*/
tree_t 
tree_create(pnew_f new, icmp_f acmp, icmp_f gdcmp, vdel_f del)
{
    tree_t root = malloc(sizeof(struct tree));
    if (NULL == root)
        CERR_EXIT("malloc struct tree error!");

    //初始化挨个操作
    memset(root, 0, sizeof(struct tree));
    root->new = new;
    root->acmp = acmp;
    root->gdcmp = gdcmp;
    root->del = del;

    return root;
}

/*
* proot  : 指向tree_t 根结点的指针,
* node      : 待处理的结点对象, 会调用new(node) 创建新结点
* ret    : proot 即是输入参数也是返回参数,返回根结点返回状况
*/
void 
tree_add(tree_t* proot, void* node)
{
    tree_t tm;
    struct __tnode *n, *p = NULL;
    icmp_f cmp;
    int tmp = 0;

    if ((!proot) || (!node) || !(tm = *proot)) //参数无效直接返回
        return;
    if (!(n = tm->root)) { //插入的结点为头结点,直接赋值返回
        tm->root = tm->new(node);
        return;
    }
    //下面开始找 待插入结点
    cmp = tm->acmp;
    while (n) {
        if ((tmp = cmp(node, n)) == 0) //这种情况是不允许插入的
            return;
        p = n;
        if (tmp < 0)
            n = n->lc;
        else
            n = n->rc;
    }

    //找见了开始插入结点
    if (tmp < 0)
        p->lc = tm->new(node);
    else
        p->rc = tm->new(node);
}

/*
* proot  : 输入和输出参数,指向根结点的指针
* node   : 删除结点,这里会调用 cmp(node 左参数, foreach) 找见,通过del(find) 删除
*/
void 
tree_del(tree_t* proot, void* node)
{
    tree_t tm;
    struct __tnode *n, *p, *t, *tp;
    if ((!proot) || (!node) || !(tm = *proot) || !(tm->root))
        return;
    //查找一下这个结点,如果不存在直接返回
    if (!(n = tree_get(tm, node, (void**)&p)))
        return;
    //第一种删除和操作
    if ((!n->lc || !n->rc) && !(t = n->lc)) 
            t = n->rc;
    else { //第二种情况,将右子树最小结点和当前删除结点交换
        for (tp = n, t = tp->rc; (t->lc); tp = t, t = t->lc)
            ; //找见了最小的左子树结点n 和父结点p
        if (tp->lc == t)
            tp->lc = t->rc;
        else
            tp->rc = t->rc;
        //移动孩子关系
        t->lc = n->lc;
        t->rc = n->rc;
    }

    if (!p) //设置新的root结点
        tm->root = t;
    else {
        if (p->lc == n) //调整父亲和孩子关系,需要你理解二叉查找树,否则那就相信我吧
            p->lc = t;
        else
            p->rc = t;
    }
    //这里释放那个结点
    if (tm->del)
        tm->del(n);
}

/*
* root   : 根结点,查找的总对象
* node   : 查找条件,会通过cmp(node, foreach)去查找
* parent : 返回查找到的父亲结点
* ret     : 返回查找到的结点对象
*/
void* 
tree_get(tree_t root, void* node, void** parent)
{
    struct __tnode *n, *p = NULL;
    icmp_f cmp;
    int tmp;

    if(parent) //初始化功能
        *parent = NULL;
    if ((!node) || (!root) || !(n = root->root))
        return NULL;
    //查找结点
    cmp = root->gdcmp;
    while (n) {
        if ((tmp = cmp(node, n)) == 0){ //这种情况是不允许插入的        
            //返回父亲结点,没有就置空
            if (parent)
                *parent = p;    
            break;
        }
        p = n;
        if (tmp < 0)
            n = n->lc;
        else
            n = n->rc;
    }

    return n;
}

//实际的删除函数,采用后续删除
static void __tree_destroy(struct __tnode* root, vdel_f del)
{
    if (root) {
        __tree_destroy(root->lc, del);
        __tree_destroy(root->rc, del);
        del(root); //结点删除采用注册方法
    }
}

/*
 * proot  : 指向二叉树数结点指针
 * 会调用 del(foreach) 去删除所有结点,并将所有还原到NULL
 */
void 
tree_destroy(tree_t* proot)
{
    tree_t root;
    if ((!proot) || !(root = *proot))
        return;
    if (root->root && root->del)
        __tree_destroy(root->root, root->del);
    free(*proot); //单独释放最外层内容
    *proot = NULL;
}

总长度还是比较短的.上面代码写了几遍,都没有加测试接口. 后面单独写测试demo.因为是封装库的库,测试代码会多一点.

 

3.说测试结果

  到这里就是说测试的时候,先简单看一个test.c 测试,编译命令是

gcc -g -Wall -o test.out test.c tree.c

源码如下

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include "tree.h"

//通用结构体变量
struct dict {
    _TREE_HEAD;
    char* key;
    char* value;
};

static void* __dict_new(void* arg)
{
    return arg;
}

//为了通用库,这种比较算法比较不好,采用hash不能够唯一确定
static int __dict_acmp(struct dict* ln, struct dict* rn)
{
    return strcmp(ln->key, rn->key);
}
static int __dict_gdcmp(const char* ln, struct dict* rn)
{
    return strcmp(ln, rn->key);
}


/*
 * 这里测试 tree.c 基类型测试的
 */
int main(int argc, char* argv[])
{
    struct dict *pd , *pp;
    struct dict dt1 = { { 0, 0 }, "123", "123" };
    struct dict dt2 = { { 0, 0 }, "1","1" };
    struct dict dt3 = { { 0, 0 }, "2","2" };
    struct dict dt4 = { { 0, 0 }, "456", "456" };
    struct dict dt5 = { { 0, 0 }, "7","7" };

    //创建一个结点,后面创建删除
    tree_t root = tree_create(__dict_new, (icmp_f)__dict_acmp, (icmp_f)__dict_gdcmp, NULL);

    //开始添加结点
    tree_add(&root, &dt1);
    tree_add(&root, &dt2);
    tree_add(&root, &dt3);
    tree_add(&root, &dt4);
    tree_add(&root, &dt5);

    //得到这个结点,并返回
    pd = tree_get(root, "123", NULL);
    printf("key:[%s], value:[%s].\n", pd->key, pd->value);

    pd = tree_get(root, "456", (void**)&pp);
    printf("key:[%s], value:[%s].\n", pd->key, pd->value);
    printf("key:[%s], value:[%s].\n", pp->key, pp->value);

    //删除结点测试,这个普通树型结构确实不好
    tree_del(&root, "123");
    pd = tree_get(root, "456", (void**)&pp);
    printf("key:[%s], value:[%s].\n", pd->key, pd->value);
    if (!pp)
        puts("应该不存在的!");

    //通过单点调试,内存检测一切正常
    tree_destroy(&root);

    system("pause");
    return 0;
}

测试结果,原先是在window上,后面在Linux上测试了.结果如下

一切正常.

第二个测试,测试在堆上分配是否正常 main.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
#include "tree.h"

//继续测试堆上分配
struct node {
    _TREE_HEAD;
    char* key;
    char* value;
};

//构建运用到的函数
static void* __node_new(struct node* n)
{
    struct node* nn = calloc(1, sizeof(struct node));
    if(NULL == nn)
        CERR_EXIT("malloc struct node error!");    
    nn->key = n->key;    
    nn->value = n->value;    
    //返回最终结果
    return nn;
}

//添加时候查找函数
static int __node_acmp(void* ln, void* rn)
{
    return strcmp(((struct node*)ln)->key, ((struct node*)rn)->key);
}

//查找和删除的查找函数
static int __node_gdcmp(void* ln, void* rn)
{
    return strcmp(ln, ((struct node*)rn)->key);
}

//简单测试函数
static void __node_puts(void* arg)
{
    struct node* n = arg;
    if(NULL == n)
        puts("now node is empty!");
    else
        printf("key:%s, value:%s.\n", n->key, n->value);
}

//简单释放函数
static void __node_delete(void* arg)
{
    __node_puts(arg);
    free(arg);
}

//写到这里自己都想抱怨一句前戏太长了, tree.c 其实本质是个通用算法库,...

/*
 * 这里继续测试一下 tree 基类库接口
 */
int main(int argc, char* argv[])
{
    tree_t root = tree_create(__node_new, __node_acmp, __node_gdcmp, __node_delete);            

    //这里就添加结点
    struct node ntmp = { {NULL, NULL}, "a", "123"};
    tree_add(&root, &ntmp);
    
    ntmp.key = "bb";
    ntmp.value = "ccccccc";
    tree_add(&root, &ntmp);
    
        
    ntmp.key = "bbc";
    ntmp.value = "ccccccc";
    tree_add(&root, &ntmp);
        
    ntmp.key = "bbcc";
    ntmp.value = "ccccccc";
    tree_add(&root, &ntmp);
    
    ntmp.key = "bbcccc";
    ntmp.value = "dd你好ccc";
    tree_add(&root, &ntmp);
    //tree_destroy(&root);    

    if(NULL == root)
        puts("root is null");
    ntmp.key = "好的";
    ntmp.value = "cccok就这样c";
    tree_add(&root, &ntmp);

    //这里查找结点
    void *p, *n;
    n = tree_get(root, "好的", &p);
    if(p)
        __node_puts(p);
    else
        puts("没有父结点");    
    __node_puts(n);

    //删除结点
    tree_del(&root, "好的");    

    tree_destroy(&root);

    return 0;
}

编译命令,Makefile文件内容如下

main.out:main.c tree.c
    gcc -g -Wall -o $@ $^

运行结果截图如下

一切正常没有内存泄露.

后面准备到库再进行生产测试.

 

后记

  这里,这个基础tree C库基本封装了,根据库简单修改一下基本就可以用在开发中了.下一个版本利用这个库 构造一个 C 配置文件读取接口.

让框架具备简单配置文件热读取的能力.扯一点,像这些解析配置的引擎难点都在 语法解析上.其它都好搞.以后有机会带大家手把手写json,csv 解析'引擎'.

这里就这样了. 错误是难免的, 因为经历的太少, 拜~.

 

posted on 2016-02-03 08:56  喜欢兰花山丘  阅读(926)  评论(0编辑  收藏  举报