2021年8月20日

B-box Loss of Detection

摘要: 目标检测作为一种经典的CV任务,大致可以认为是三个子任务的集合:1、确定目标大概位置;2、分类出目标类别;3、回归出检测框的宽高。 这三种子任务分别需要对应损失函数的反向传播来学习。本文介绍的b-box回归损失函数主要是面向第三个子任务而设计的损失函数。 IOU 原文链接:[1608.01471] 阅读全文

posted @ 2021-08-20 09:51 Peyton_Li 阅读(126) 评论(0) 推荐(0) 编辑

2021年3月29日

分类任务模型训练的一些心得

摘要: 常见的分类方法,softmax分类和回归分类。 如果类别之间没有关系,相互独立,那么就比较适合softmax分类,或者回归分类。 如果类别之间存在歧义或者不明确,则可以使用multi label或者label distribution learning。 如果类别之间存在某种程度排序,则比较适合回归 阅读全文

posted @ 2021-03-29 17:00 Peyton_Li 阅读(132) 评论(0) 推荐(0) 编辑

2020年3月12日

针孔相机模型及其标定

摘要: 针孔相机模型 1. 坐标系介绍 在视觉应用中,总共有四个坐标系需要了解,分别是:像素坐标系(p)、图像坐标系(i)、相机坐标系(c)、世界坐标系(w)。而相机就是将世界坐标系映射到了像素坐标系。 像素坐标系 图像在相机内部的储存形式类似像素坐标系,如下图所示,其中一个像素的坐标为$(u_{i}, v 阅读全文

posted @ 2020-03-12 12:45 Peyton_Li 阅读(1009) 评论(2) 推荐(0) 编辑

2019年12月4日

反卷积(Transposed Convolution)

摘要: 反卷积的具体计算步骤 令图像为 卷积核为 case 1 如果要使输出的尺寸是 5x5,步数 stride=2 ,tensorflow 中的命令为: transpose_conv = tf.nn.conv2d_transpose(value=input, filter=kernel, output_s 阅读全文

posted @ 2019-12-04 13:53 Peyton_Li 阅读(2272) 评论(0) 推荐(0) 编辑

2019年11月27日

卷积层输出feature maps尺寸的计算

摘要: 默认feature maps的宽和高相等。 常规卷积 输入的feature maps尺寸为i,卷积核的尺寸为k,stride为s,padding为p,则输出的feature maps的尺寸o为 当padding为 VALID 时,p 值等于 0,代入相应的 i,k,p,s 就可以相应的计算出 o 值 阅读全文

posted @ 2019-11-27 14:24 Peyton_Li 阅读(588) 评论(0) 推荐(0) 编辑

2019年11月25日

C++踩坑——用memset对vector进行初始化

摘要: 在一段程序中,使用memset对vector进行了初始化,然后得到了错误的结果。找这个bug花费了很长时间。 vector中有其自身的结构,不能单纯的按字节进行初始化。使用memset对vector进行初始化,会破坏vector中的结构,造成vector中的数据错误。我使用memset将vector 阅读全文

posted @ 2019-11-25 11:12 Peyton_Li 阅读(3167) 评论(0) 推荐(1) 编辑

2019年7月17日

GoogLeNet结构

摘要: Inception v1 论文:《Going deeper with convolutions》 在较低的层(靠近输入的层)中,相关单元更侧重提取局部区域的信息。因此使用1x1的特征可以保存这些特征,从而与其他支路提取的特征进行融合。 3x3和5x5的卷积是想要提取不同尺度的特征,3x3卷积和5x5 阅读全文

posted @ 2019-07-17 14:54 Peyton_Li 阅读(3441) 评论(0) 推荐(0) 编辑

2019年7月8日

softmax求导、cross-entropy求导及label smoothing

摘要: softmax求导 softmax层的输出为 其中,表示第L层第j个神经元的输入,表示第L层第j个神经元的输出,e表示自然常数。 现在求对的导数, 如果j=i, 1 如果ji, 2 cross-entropy求导 loss function为 对softmax层的输入求导,如下 label smoo 阅读全文

posted @ 2019-07-08 11:57 Peyton_Li 阅读(1336) 评论(0) 推荐(1) 编辑

2019年6月14日

C++中的传值与传址

摘要: 在指针的传递中,也涉及到传值与传址的问题。下面通过一个函数进行说明。 代码如下: 在上面的代码中,执行过openBinary函数后,buffer_0依然是一个空指针。 原因是因为执行openBinary函数时,函数生成了一个值与buffer_0相同的uchar*临时变量buffer,在分配内存前,临 阅读全文

posted @ 2019-06-14 15:04 Peyton_Li 阅读(931) 评论(0) 推荐(0) 编辑

2019年4月30日

TensorFlow模型转为caffe模型

摘要: 最近由于要将训练好的模型移植到硬件上,因此需要将TensorFlow转为caffe模型。 caffe模型需要两个文件,一个是定义网络结构的prototxt,一个是存储了参数的caffemodel文件。只要生成这两个文件,caffe模型就算转好了。 在模型转换的过程中,我主要参考了https://gi 阅读全文

posted @ 2019-04-30 16:53 Peyton_Li 阅读(5884) 评论(13) 推荐(0) 编辑

导航