《STL源码剖析》之vector
STL中容器分为序列式容器和关联式容器,其中vector作为最常用的序列式容器之一。
vector基于array,准确的说是基于分配的连续内存,当内存不够使用时,就在分配一块内存,一般来说(源自《c++ primer》和《STL源码剖析》)再分配内存是内存大小是前一大小的两倍即可。这样有效的防止连续空间在进行数据使用时超出范围的问题。
template<typename T,typename Alloc=alloc> class vector { public: typedef T value_type; typedef value_type* pointer; typedef ptrdiff_t difference_type; typedef value_type* iterator; typedef value_type& reference; typedef size_t size_type; protected: typedef simple_alloc<value_type,Alloc> data_alllocator; // ..... 其他的后面再说 };
我们可以看出来,这里vector的Iterator是T*,即vector<T>::iterator-->T*。当然这个显而易见,这与后面的deque等的iterator差别很大。这样在效率上就会有很好的保障,同样安全性也会有很好的体现。
在vector中有几个函数用到的非常多:fill_initialize,uninitialized_fill_n,以及copy,第一个为对已分配内存进行初始化并且指示出开头结尾,第二个为STL中的一个全局函数,用作将从heap得到的内存初始化。第三个就是数据转移,这个函数对于vector属于至关重要的一个。
//----------------------fill_initlialize------------------------------ void fill_initialize(size_type n, const T& value) { start=allocate_and_fill(n,value); //start已使用空间的头部iterator finish=start +n; //finish已使用空间的尾部iterator end_of_storage=finish; //end_of_storage分配空间的尾部iterator }
//------------------------alloccate_and_fill------------------------------ iterator allocate_and_fill(size_type n,const T&x) { iterator result=data_allocator::allocate(n); uninitialized_fill_n(result,n,x); return result; }
我们可以看出fill_initialize函数是将allocate_and_fill函数和iterator的开头结尾工作进行合并。
//------------------------public函数部分体现-------------------------------- template<typename T,typename Alloc=alloc> class vector {//..............数据部分暂且不提及 public: iterator begin(); iterator end(); vector(); vector(size_type n,const T&value); vector(int n,const T&value); vector(long n,const T&value); reference operator[](size_type n); size_type size(); void push_back(const T&x); //......其余省略 };
从上面我们可以看出vector具有至少三个构造函数,这里对应了上面提及的fill_initialize函数,利用这个函数可以进行同一数据的多点多次存储。
vector必须有[]操作,因为我们在使用过程中往往可以将它看成一个无底数组,这样大大增加了使用起来的便利程度。
size函数这里的实现非常简单,因为vector不同于deque。vector作为一种连续存储容器,且Iterator作为typedef value* iterator可直接对iterator进行operator-或者operator+。
push_back即首先判断finish++>end_of_storage,如果是,则先分配较前者内存大小两倍内存,然后进行大块数据copy,在进行内存的initialize。
//--------------------insert,erase实现-------------------------------------- iterator erase(iterator first,iterator last) { iterator i= copy(last,finish,first); //copy全局函数 destroy(i,finish); finish=finish-(last-first); return first; } iterator erase(iterator position) { if(position+1!=end()) copy(position+1,finish,position); --finish; destroy(finish); return position; } //______________________________________ template<typename T,typename Alloc> void vector<T,Alloc>::insert(iterator position,size_type n, const T& x) { if(n!=0) { if(size_type(end_of_storage-finish)>=n) { T x_copy=x; const size_type elems_after=finish-position; iterator old_finish=finish; if(elems_after>n) { uninitialized_copy(finish-n,finish,finish); finish+=n; copy_backward(position,old_finish,finish); fill(position,position+n,x_copy); } else { uninitialized_fill_n(finish,n-elems_after,x_copy); finish+=n-elems_after; uninitialized_copy(position,old_finish,finish); finish+=elems_after; fill(position,old_finish,x_copy); } } else { //备用空间小于新增元素个数 const size_type old_size=size(); const size_type len=old_size+max(old_size,n); iterator new_start=data_allocator::allocate(len); iterator new_finish=new_start; //---------------分配空间及异常处理,不再续写 } }

上图作为insert操作的图示可以看出,insert需要保存position点或者position段之后的数据,也就是说我们需要在插入之前把finish到position->first点之间的所有数据全部向后移动size(position)个位置。
于是我们必须考虑以下情况:
1 size(position)==0,那就不用移动了。
2 为初始化空间尚能容下size(position),如果不能则需要重新分配更大空间然后进行数据复制,在进行insert操作
3 size(position)>position->last-finish,先在finish后面初始化position的元素的size(position)-(last-finish)部分,把last到finish之间的所有全部后移,再把position前部放进去
4size(position)<position->last-finish ,直接进行后移即可。
erase操作不同于insert,他需要把数据磨灭即可,即不管从first部分到position从前向后移动或者是从finish到position从后向前移动都可以,但是问题就在于:
1,vector不是deque,vector在头部的操作复杂度太高,而deque则可以很好解决,故我们不需要判断position的位置与(finish-first)/2的关系,deque仍须要判断,因为在大容量数据的基础上,这个仍然属于考虑范围,算法暂时无法进行优化或者进行switch,以得到特殊情况下的优化。
2,不要忘了对finish到position移动后空余空间的数据placement delete,注意,此处不是operator delete,我们需要后面的分配的空间,但是不需要数据。

浙公网安备 33010602011771号