随笔分类 - 深度学习&&实验室项目
计算机视觉
摘要:当多GPU树形拓扑构建完毕,数据预缓冲到GPU显存,开始进入多GPU并行训练。Caffe的Solver提供了两个用于多GPU训练的回调函数:on_start()和on_gradient_ready()。如图4-5所示,on_start函数用于将参数分发拷贝到每一个GPU中,on_gradeint_r
阅读全文
摘要:本弱又搬了另外一个博客的讲解: 缩进YOLO全称You Only Look Once: Unified, Real-Time Object Detection,是在CVPR2016提出的一种目标检测算法,核心思想是将目标检测转化为回归问题求解,并基于一个单独的end-to-end网络,完成从原始图像
阅读全文
摘要:faster rcnn中的rpn网络: 特征可以看做一个尺度51*39的256通道图像,对于该图像的每一个位置,考虑9个可能的候选窗口:三种面积{1282,2562,5122}×三种比例{1:1,1:2,2:1}。这些候选窗口称为anchors。下图示出51*39个anchor中心,以及9种anch
阅读全文
摘要:1、裁剪 crop size227,在训练时候采用随机裁剪,在测试时候只裁剪中间部分
阅读全文
摘要:pool层,其中ceil是向上取整函数 卷积层:
阅读全文
摘要:blockDim.x*gridDim.x 跳过一个grid int <<<参数1,参数2>>>(int *a,int * b,int * c); 如果是一维的,参数1表示一个grid里面有多少个block块,参数2表示一个block块里面有多少个thread线程 namespace caffe {
阅读全文
摘要:RELULayer层 bottom[0]->count=n*c*w*h=50*96*56*56 count=50*96*56*56,根据bottom_data[i]访问所有的数据(多维数组都是一维数组那个样子存储的,所以这样就可以访问所有的数据),同时说明,一批50是一起计算的 conv_layer
阅读全文
摘要:首先修改src/caffe/proto/下的caffe.proto,修改好后需要编译 然后修改include/caffe/layers/logwxl_layer.hpp 然后修改src/caffe/layers/logwxl_layer.cpp和logwxl_layer.cu 最后make all
阅读全文
摘要:'(0, 2)','(4, 6)','(8, 12)','(15, 20)','(25, 32)','(38, 43)','(48, 53)','(60, 100)' 卷积-relu-pooling-Local Response Normalization (LRN)层 卷积-relu-poolin
阅读全文
摘要:训练时, solver.prototxt中使用的是train_val.prototxt ./build/tools/caffe/train -solver ./models/bvlc_reference_caffenet/solver.prototxt 使用上面训练的网络提取特征,使用的网络模型是d
阅读全文
摘要:世界坐标系:是为了描述相机的位置而被引入的 相机坐标系: 整个转换过程:世界坐标系中点经过R,T到相机坐标系,经过投影关系到像素坐标系,像素坐标系再转换到像屏幕坐标系,这样就是我们看到的二维图像上的坐标位置了。 相机的内参数,dx,dy,u0,v0,that(最后,由于相机制造工艺的误差,相机的成像
阅读全文

浙公网安备 33010602011771号