C中级 消息队列设计

引言  - 补充好开始

  消息队列在游戏服务器层应用非常广泛. 应用于各种耗时的IO操作业务上.消息队列可以简单理解为

[消息队列 = 队列 + 线程安全]本文参照思路如下, 最后献上一个大神们斗法的场景O(∩_∩)O哈哈~

     回调还是消息队列         -> 架构的选择

     skynet 全局消息队列    -> skynet_mq.c

     消息队列血案 https://www.douban.com/note/470290075/

消息队列最方便之处在于让异步编程变得简单高效.(异步搞成同步). 多数应用于如下方面,消息收发处理,

DB消息写入, 日志系统等等. 运用在密集型IO处理业务中. 关于消息队列的套路太多了,

下面所要分析的消息队列, 算不上高效但绝不低效. 但是安全省内存. 可以用于实战.

用到的原子锁接口 scatom.h (2017年5月10日15:05:42)

#ifndef _H_SIMPLEC_SCATOM
#define _H_SIMPLEC_SCATOM

/*
 * 作者 : wz
 *
 * 描述 : 简单的原子操作,目前只考虑 VS(CL) 小端机 和 gcc
 *         推荐用 posix 线程库
 */

#define _INT_USLEEP_LOCK (1)

// 如果 是 VS 编译器
#if defined(_MSC_VER)

#include <Windows.h>

//忽略 warning C4047: “==”:“void *”与“LONG”的间接级别不同
#pragma warning(disable:4047) 

// v 和 a 都是 long 这样数据
#define ATOM_FETCH_ADD(v, a) InterlockedExchangeAdd((LONG volatile *)&(v), (LONG)(a))

#define ATOM_ADD_FETCH(v, a) InterlockedAdd((LONG volatile *)&(v), (LONG)(a))

#define ATOM_SET(v, a) InterlockedExchange((LONG volatile *)&(v), (LONG)(a))

#define ATOM_CMP(v, c, a) ((LONG)(c) == InterlockedCompareExchange((LONG volatile *)&(v), (LONG)(a), (LONG)(c)))

/*
 * 对于 InterlockedCompareExchange(v, c, a) 等价于下面
 * long tmp = v ; v == a ? v = c : ; return tmp;
 * 
 * 咱们的 ATOM_FETCH_CMP(v, c, a) 等价于下面
 * long tmp = v ; v == c ? v = a : ; return tmp;
 */
#define ATOM_FETCH_CMP(v, c, a) InterlockedCompareExchange((LONG volatile *)&(v), (LONG)(a), (LONG)(c))

#define ATOM_LOCK(v) \
    while(ATOM_SET(v, 1)) \
        Sleep(_INT_USLEEP_LOCK)

#define ATOM_UNLOCK(v) ATOM_SET(v, 0)

// 保证代码不乱序优化后执行
#define ATOM_SYNC()    MemoryBarrier()

// 否则 如果是 gcc 编译器
#elif defined(__GNUC__)

#include <unistd.h>

/*
 * type tmp = v ; v += a ; return tmp ;
 * type 可以是 8,16,32,64 bit的类型
 */
#define ATOM_FETCH_ADD(v, a) __sync_fetch_add_add(&(v), (a))

/*
 * v += a ; return v;
 */
#define ATOM_ADD_FETCH(v, a) __sync_add_and_fetch(&(v), (a))

/*
 * type tmp = v ; v = a; return tmp;
 */
#define ATOM_SET(v, a) __sync_lock_test_and_set(&(v), (a))

/*
 * bool b = v == c; b ? v=a : ; return b;
 */
#define ATOM_CMP(v, c, a) __sync_bool_compare_and_swap(&(v), (c), (a))

/*
 * type tmp = v ; v == c ? v = a : ;  return v;
 */
#define ATOM_FETCH_CMP(v, c, a) __sync_val_compare_and_swap(&(v), (c), (a))

/*
 * 加锁等待,知道 ATOM_SET 返回合适的值
 * _INT_USLEEP 是操作系统等待纳秒数,可以优化,看具体操作系统
 * 
 * 使用方式
 *  int lock = 0;
 *  ATOM_LOCK(lock);
 *  
 *  // to do think ...
 *  
 *  ATOM_UNLOCK(lock);
 *
 */
#define ATOM_LOCK(v) \
    while(ATOM_SET(v, 1)) \
        usleep(_INT_USLEEP_LOCK)

// 对ATOM_LOCK 解锁, 当然 直接调用相当于 v = 0;
#define ATOM_UNLOCK(v) __sync_lock_release(&(v))

// 保证代码不乱序
#define ATOM_SYNC()    __sync_synchronize()

#endif // !_MSC_VER && !__GNUC__

/*
 * 试图加锁, 使用例子
 
     if(ATOM_TRYLOCK(v)) {
         // 已经有人加锁了, 处理返回事件
        ...
     }
 
     // 得到锁资源, 开始处理
     ...
 
     ATOM_UNLOCK(v);
 
 * 返回1表示已经有人加锁了, 竞争锁失败.
 * 返回0表示得到锁资源, 竞争锁成功
 */
#define ATOM_TRYLOCK(v) ATOM_SET(v, 1)

#endif // !_H_SIMPLEC_SCATOM
View Code

  到这里不妨再扯一点. 盲目的使用消息队列也是存在缺点的, 因为消息队列是存在开销的, 堆上内存的来回分配.

线程的无脑轮序. 有机会我在日志系统上再做一次对比分析. 每一个设计思路的选择, 一定要切合业务.

 

前言 - 我们来谈一谈设计

  首先看消息队列接口设计. 创建, 销毁, 入队, 出队, 队长度 这些操作. 主要体现在 mq.h 中

#ifndef _H_SIMPLEC_MQ
#define _H_SIMPLEC_MQ

typedef struct mq * mq_t;

//
// mq_create - 创建一个消息队列类型
// return    : 返回创建好的消息队列对象, NULL表示失败
//
extern mq_t mq_create(void);

//
// mq_delete - 删除创建消息队列, 并回收资源
// mq        : 消息队列对象
// return    : void
//
extern void mq_delete(mq_t mq);

//
// mq_push - 消息队列中压入数据
// mq        : 消息队列对象
// msg       : 压入的消息
// return    : void
// 
extern void mq_push(mq_t mq, void * msg);

//
// mq_pop - 消息队列中弹出消息,并返回
// mq        : 消息队列对象
// return    : 返回队列尾巴, 队列为empty返回NULL
//
extern void * mq_pop(mq_t mq);

//
// mq_len - 得到消息队列的长度,并返回
// mq        : 消息队列对象
// return    : 返回消息队列长度
// 
extern int mq_len(mq_t mq);

#endif // !_H_SIMPLEC_MQ

要不来个题外话, 为什么不用 /**/ 多行注释, 而采用 // 多行注释呢. 其实原因是 Visual Studio 中 /**/ 多行注释复制会

错位. 就喜欢用// 注释, 显得有美感. 有兴趣的朋友可以参照上面注释写法虽然繁琐, 但是加深的业务的理解.

扯个淡, C 中有几种注释的方式. 哈哈, 是不是也可以做个面试题.

那我们开始扯扯详细设计思路吧, 一切从结构开始

//
// 队列empty    <=> tail == -1 ( head = 0 )
// 队列full     <=> head == cap
//
struct mq {
    int lock;            // 消息队列锁
    int cap;             // 消息队列容量, 必须是2的幂
    int head;            // 消息队列头索引
    int tail;            // 消息队列尾索引
    void ** queue;       // 具体的使用消息
};

它是个环形的队列,

这么做的好处是, 能够使用完所有的空间, 存在真的满情况. 云大大的消息队列是假满,

每次满的时候立即扩充内存. 永远存在内存冗余. 再介绍一个思路. 当消息量多了, 需要扩容这里采用的算法是.

  1) realloc 扩充内存

  2) 整理消息内存移动到 head = 0头部开始

 

其实这里有个更简单的做法 两次malloc , 移动内存位置. 但是 realloc 对内存重新申请做了优化. 毕竟内存IO申请操作更加恶心复杂.

扯淡一点, 代码不值钱, 思路值钱. 或者说最值钱的自己. 最值得投资的也是自己. 前提是能给别人带来快乐.

 

正文  - 正儿八经的实现

  最终的设计版本 mq.c 

#include <assert.h>
#include <scatom.h>
#include <mq.h>

// 2 的 幂
#define _INT_MQ                (1 << 6)

//
// 队列empty   <=> tail == -1 ( head = 0 )
// 队列full    <=> head == cap
//
struct mq {
    int lock;            // 消息队列锁
    int cap;             // 消息队列容量, 必须是2的幂
    int head;            // 消息队列头索引
    int tail;            // 消息队列尾索引
    void ** queue;       // 具体的使用消息
};

//
// mq_create - 创建一个消息队列类型
// return    : 返回创建好的消息队列对象, NULL表示失败
//
inline mq_t 
mq_create(void) {
    struct mq * q = malloc(sizeof(struct mq));
    assert(q);
    q->lock = 0;
    q->cap = _INT_MQ;
    q->head = 0;
    q->tail = -1;
    q->queue = malloc(sizeof(void *) * _INT_MQ);
    return q;
}

//
// mq_delete - 删除创建消息队列, 并回收资源
// mq        : 消息队列对象
// return    : void
//
inline void 
mq_delete(mq_t mq) {
    if (mq) {
        free(mq->queue);
        free(mq);
    }
}

// add two cap memory, memory is do not have assert
static void
_expand_queue(struct mq * mq) {
    int i, j, cap = mq->cap << 1;
    void ** nqueue = realloc(mq->queue, sizeof(void *) * cap);
    assert(nqueue);
    
    // 开始移动内存位置
    for (i = 0; i < mq->head; ++i) {
        void * tmp = mq->queue[i];
        for (j = i; j < mq->cap; j += mq->head) 
            mq->queue[j] = mq->queue[(mq->head + j) & (mq->cap - 1)];
        mq->queue[j & (mq->cap - 1)] = tmp;
    }
    
    mq->head = 0;
    mq->tail = mq->cap;
    mq->cap  = cap;
    mq->queue = nqueue;
}

//
// mq_push - 消息队列中压入数据
// mq        : 消息队列对象
// msg       : 压入的消息
// return    : void
// 
void 
mq_push(mq_t mq, void * msg) {
    int tail;
    assert(mq && msg);
    ATOM_LOCK(mq->lock);

    tail = (mq->tail + 1) & (mq->cap - 1);
    // 队列为full的时候申请内存
    if (tail == mq->head && mq->tail >= 0)
        _expand_queue(mq);
    else
        mq->tail = tail;

    mq->queue[mq->tail] = msg;

    ATOM_UNLOCK(mq->lock);
}

//
// mq_pop - 消息队列中弹出消息,并返回
// mq        : 消息队列对象
// return    : 返回队列尾巴, 队列为empty返回NULL
//
void * mq_pop(mq_t mq) {
    void * msg = NULL;
    assert(mq);

    ATOM_LOCK(mq->lock);

    if (mq->tail >= 0) {
        msg = mq->queue[mq->head];
        if(mq->tail != mq->head)
            mq->head = (mq->head + 1) & (mq->cap - 1);
        else {
            // 这是empty,情况, 重置
            mq->tail = -1;
            mq->head = 0;
        }
    }

    ATOM_UNLOCK(mq->lock);

    return msg;
}

//
// mq_len - 得到消息队列的长度,并返回
// mq        : 消息队列对象
// return    : 返回消息队列长度
// 
int 
mq_len(mq_t mq) {
    int head, tail, cap;
    assert(mq);

    ATOM_LOCK(mq->lock);

    cap = mq->cap;
    head = mq->head;
    tail = mq->tail;

    ATOM_UNLOCK(mq->lock);

    tail -= head - 1;
    return tail < 0 ? tail + cap : tail;
}

从上面设计也能看出来, 一遇到全局的立马加自旋锁. 一种最保守也是最安全的做法. 绝逼不会错. 不要问为啥.

因为最终在大大们的争吵中选了正确的易维护的代码思路.   这里再扯一下, 在库设计中很多为 unsigned, signed

的取舍而费脑筋. 我有个经验如果不存在 - or -- 操作, unsigned 是最优的. 存在大量 - or -- 操作可以使用

signed这样容易维护. 这块是bug 高发区.

 

后记 - 解决问题, 从大道理开始

  男人哭吧不是罪  http://www.xiami.com/song/374995

     

    

 

posted on 2017-05-10 17:55  喜欢兰花山丘  阅读(388)  评论(1编辑  收藏  举报