Fork me on GitHub

caffe 框架梳理(待续)

    使用pycaffe生成train.protxt、test.prototxt
    使用pycaffe生成solver.prototxt
    数据层、视觉层、激活层等知识点回顾

caffe:全称Convolutional Architecture for Fast Feature Embedding,是一个计算CNN 相关算法的框架,用C++和Python实现的。

Caffe的优点与局限性

优点:
• 1. 第一个主流的工业级深度学习工具。
• 2. 专精于图像处理
• 局限性:
• 1. 它有很多扩展,但是由于一些遗留的架构问题,不够灵活且对递归网络和语言建模的支持很差。
• 2. 基于层的网络结构,其扩展性不好,对于新增加的层,需要
自己实现(forward, backward and gradient update)

Caffe目录结构

• data/ 用于存放下载的训练数据
• docs/ 帮助文档
• examples/ 代码样例
• matlab/ MATLAB接文件
• python/ PYTHON接文件
• models/ 一些配置好的模型参数
• scripts/ 一些文档和数据会用到的脚本核心代码
• tools/ 保存的源码是用于生成二进制处理程序的,caffe在训练时实际是直接调用这些二进制文件
• include/ Caffe的实现代码的头文件
• src/ 实现Caffe的源文件

src/ 文件结构

gtest/ google test 一个用于测试的库,你make runtest时看见的很多绿⾊色RUN OK就是它,这个与caffe的学习无关,不过是个有用的库

caffe/ 关键代码

• test/ 用gtest测试caffe的代码
• util/ 数据转换时用的一些代码。caffe速度快,很大程度得益于内存设计上的优化(blob数据结构采用proto)和对卷积的优化(部分与im2col相
关)
• proto/ 即所谓的“Protobuf”,全称“Google Protocol Buffer”,是一种数据存储格式,帮助caffe提速
• layers/ 深度神经网络中的基本结构就是一层层互不相同的网络了,这个
文件夹下的源文件以及目前位置“src/caffe”中包含所有.cpp文件就是caffe的核心目录下的核心代码了。

Caffe核心代码

• blob[.cpp .h] 基本的数据结构Blob类
• common[.cpp .h] 定义Caffe类
• internal_thread[.cpp .h] 使用boost::thread线程库
• net[.cpp .h] 网络结构类Net
• solver[.cpp .h] 优化方法类Solver
• data_transformer[.cpp .h] 输入数据的基本操作类DataTransformer
• syncedmem[.cpp .h] 分配内存和释放内存类CaffeMallocHost,用于同步GPU,CPU数据
• layer[.cpp .h] 层类Layer
• layers/ 此文件夹下面的代码全部至少继承了类Layer, 从layer_factory中注册继承

1. Caffe三级结构(Blobs,Layers,Nets)

• Blob:用于数据的保存、交换和操作,Caffe基础存储结构
• Layer:用于模型和计算的基础
• Net:整合连接Layers

 

posted @ 2018-10-03 15:45  ranjiewen  阅读(651)  评论(0编辑  收藏  举报