STL中改变map的默认比较方式

大家知道,STL中的map底层是用红黑树实现的,其泛型原型如下:

template <class _Key, class _Tp, class _Compare, class _Alloc>
class map {
......
}

其中_Key表示比较的键(key),_Tp表示值(value),_Compare表示比较方式,_Alloc表示内存分配器。

一般我们在写map的时候总是类似于写出如下代码:

map<int, char*>* my_map = new map<int, char*>;

表示键为int类型,值为字符串类型。这里之所以不对_Compare和_Alloc加以限制,是因为int是C++内置类型,有默认比较方式,_Alloc也采用STL的

默认的内存方案。但是如果有如下结构体:

struct Term{
char* str;
int hashCode;
};

现在我们要将该Term作为map的键,并假设Term所对应的值为Term出现的频率(int型),那么能不能这样写:

map<Term, int>* my_map = new map<Term, int>;

显然这样写map是无法正常运作的,原因是struct Term并非C++的内置类型,默认不知道如何去比较它。这时候就需要修改map的默认比较方式:

template <class T>
struct Compare
{
int operator()(const T& x, const T& k) const{
if(x.hashCode >= k.hashCode) return 0;
else return 1;
}
};

这里采用的是函数对象(function object)的方式去加载map的比较方式,表示使用Term的hashCode作为比较方式,以对红黑树进行查找、插入等操作。

这样我们就可以把map写成下面的形式:

map<Term, int, Compare<Term> >* my_map = new map<Term, int, Compare<Term> >;

这样map就可以正常运作了,比如进行插入操作:

Term my_term;
my_map
->insert(make_pair(my_term, 1));

但是上面的struct Compare为什么要写成这样的形式,写成这样行不行:

template <class T>
struct Compare
{
int operator()(const T& x, const T& k) const{
if(x.hashCode >= k.hashCode) return 1;
else return 0;
}
};

这是不行的。为什么不行,首先来看一看map中find的源代码:

template <class _Key, class _Value, class _KeyOfValue, 
class _Compare, class _Alloc>
typename _Rb_tree
<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::iterator
_Rb_tree
<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::find(const _Key& __k)
{
_Link_type __y
= _M_header; // Last node which is not less than __k.
_Link_type __x = _M_root(); // Current node.

while (__x != 0)
if (!_M_key_compare(_S_key(__x), __k))
__y
= __x, __x = _S_left(__x);
else
__x
= _S_right(__x);

iterator __j
= iterator(__y);
return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;
}

上面的代码中_M_key_compare就表示我们的那个比较函数对象,_S_key(__x)表示取__x节点的key,并和__k比较。

if (!_M_key_compare(_S_key(__x), __k))
__y
= __x, __x = _S_left(__x);

表示如果_S_key(__x) >= __k即,如果节点的key大于或等于查找的key那么就__x就等于它的左子节点,否则就为右子节点。

但为什么等于的时候不直接返回呢,却在继续查找?举个例子来说:

如果我们要查找key为10的节点是否在树中时,首先从根节点开始查找,由于8<10,这时_M_key_compare返回1,那么此时,

转向root的右子树,然后由于10==10,_M_key_compare返回0,这时转向左子树,但左子树是空的,循环停止。

 return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;

由于此时__j表示"10"这个节点(其实是个迭代器),由于__k为10,而__j._M_node的key为10,_M_key_compare返回0,有三元运算符可知,

此时返回是__j,即表示找到了。因此我们的比较函数对象必需写成:

当节点键大于等于所要查找或插入的键时,返回0(false),反之为1(true),这是由内部源代码所决定的。

posted @ 2011-08-12 09:08  Richard Zhong  阅读(9762)  评论(2编辑  收藏  举报