caffe blob理解

  

blob数据结构是caffe中基本的数据存储单元,它主要存储的数据是网络中的中间数据变量,比如各层的输入和输出;代价函数关于网络各层参数的梯度。

blob中除了存储数据外,还有一些标记数据的参数,以下就是一些blob中的数据成员:

protected:  
  shared_ptr<SyncedMemory> data_;  
  shared_ptr<SyncedMemory> diff_;  
  shared_ptr<SyncedMemory> shape_data_;  
  vector<int> shape_;  
  int count_;  
  int capacity_

data_:表示网络各层的输入和输出;

diff_:表示代价函数相对于各层参数的梯度;

shape_:是一个可变数组,shape_中主要存储4个变量:num表示一个batch中的样本数量,从这我们可以看出Blob的存储是以batch为基本单位的;channels表示对应层的通道,比如卷积层有20个卷积核,channels的值就是20;height和width就表示单个数据的尺寸,可能是一副图像的尺寸,也可能表示卷积核的尺寸,在每一层所代表的含义也不相同。

count_:表示这个Blob里已经存储的元素的个数;

capacity_:表示这个Blob的容量;

Blob同时保存了data_和diff_,其类型为SyncedMemory的指针,注意是指针。

Blob中除了数据成员之外,也有很多用于操作数据的函数成员,下面就说几个比较重要的:

    void Blob<Dtype>::Reshape():这个函数是在原来分配的内存不够的情况下重新分配内存。

    const Dtype* Blob<Dtype>::cpu_data():这个是获取Blob结构体中的data_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

    const Dtype* Blob<Dtype>::cpu_diff():这个是获取Blob结构体中的diff_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

    Dtype* Blob<Dtype>::mutable_cpu_data():获取Blob结构体中的data_数据的指针,同时可以对指针指向的内容更改。

    Dtype* Blob<Dtype>::mutable_cpu_diff():获取Blob结构体中的diff_数据的指针,同时可以对指针指向的内容更改。

    void Blob<Dtype>::ShareData(const Blob& other):让其他Blob的data_数据和当前Blob共享。

    void Blob<Dtype>::ShareDiff(const Blob& other):让其他Blob的diff_和当前的Blob共享。   

在blob.hpp中还有这样几个定义:

按照注释的意思,这几个函数和shape()是一样的作用。shape本身是一个vector,这个vector的size为4,第一个位置存储图片的个数,第二个存储channel的个数,以此类推。

 

逻辑上看,blob是一个四维数组。但实际上,因为数组的存储是在内存中开辟一块连续的、大小相同的的空间,所以blob的存储应该是一个一维的存储结构。只不过是利用四个参数来进行寻址(shape_里的四个参数)。并且blob是行优先的存储方式。

所以对于一个(n, k, h, w)的blob,他的维度就是n*k*h*w,在(n, k, h, w)位置的值物理位置为((n * K + k) * H + h) * W + w。

以Blob中二维矩阵为例(如全连接网络shape (N, D)),如图所示。同样的存储方式可以推广到多维。

 

 

动态多维数组:Blob 类可以动态改变数组的尺寸,当拓展数组导致原有内存空间不足以存放下数据时 (count > capacity),就会重新分配内存。Blob 提供了一组 Reshape 函数来完成这个功能。

void Reshape(const int num, const int channels, const int height, const int width); // Deprecated
void Reshape(const vector<int>& shape);
void Reshape(const BlobShape& shape);
void ReshapeLike(const Blob& other);

 Blob 类在初始化时并没有分配内存,也是通过调用 Reshape 来分配内存的。

template <typename Dtype>
void Blob<Dtype>::Reshape(const vector<int>& shape) {
  CHECK_LE(shape.size(), kMaxBlobAxes); // 检查维数
  count_ = 1; // 用于计算新的多维数组的大小
  shape_.resize(shape.size()); // 更新维数
  if (!shape_data_ || shape_data_->size() < shape.size() * sizeof(int)) {
    // shape_data_ 未初始化或者内存太小
    shape_data_.reset(new SyncedMemory(shape.size() * sizeof(int)));
  }
  int* shape_data = static_cast<int*>(shape_data_->mutable_cpu_data());
  for (int i = 0; i < shape.size(); ++i) {
    CHECK_GE(shape[i], 0);
    CHECK_LE(shape[i], INT_MAX / count_) << "blob size exceeds INT_MAX";
    count_ *= shape[i];
    shape_[i] = shape[i];
    shape_data[i] = shape[i];
  }
  if (count_ > capacity_) {
    // 内存不够
    capacity_ = count_;
    data_.reset(new SyncedMemory(capacity_ * sizeof(Dtype)));
    diff_.reset(new SyncedMemory(capacity_ * sizeof(Dtype)));
  }
}

 

 

 

http://blog.csdn.net/qq_14975217/article/details/51524042

http://blog.csdn.net/mounty_fsc/article/details/51085654

http://blog.csdn.net/buyi_shizi/article/details/51506853

 http://blog.csdn.net/jyl1999xxxx/article/details/53981813

posted @ 2017-11-07 16:49  有梦就要去实现他  阅读(3387)  评论(0编辑  收藏  举报