摘要: 第一种方法是测试批量图片,使用caffe.bin即可,首先要做的是把你的jpg图片转换为LMDB的格式,如何转换呢?用/build/tools/convert_image --resize_width 227 --resize_height 227 图片所在的目录 class.txt LMDB文件生 阅读全文
posted @ 2016-08-11 15:57 亦轩Dhc 阅读(4356) 评论(0) 推荐(0) 编辑
摘要: CS231n的课后作业非常的好,这里记录一下自己对作业一些笔记。 一、第一个是KNN的代码,这里的trick是计算距离的三种方法,核心的话还是python和machine learning中非常实用的向量化操作,可以大大的提高计算速度。 二、softmax 同样是需要完成naive和vector的两 阅读全文
posted @ 2016-08-09 19:17 亦轩Dhc 阅读(38254) 评论(12) 推荐(1) 编辑
摘要: 一、Abstract 提出了一种end-to-end的做semantic segmentation的方法,也就是FCN,是我个人觉得非常厉害的一个方法。 二、亮点 1、提出了全卷积网络的概念,将Alexnet这种的最后的全连接层转换为卷积层,好处就是可以输入任意的scale。 只不过在输出的scal 阅读全文
posted @ 2016-07-26 21:35 亦轩Dhc 阅读(10584) 评论(0) 推荐(0) 编辑
摘要: chilitags是一个相当好的CV方向的开源项目,不过在github上follow的人不多, 国内也基本没有这方面的消息,前几天同事给我安利了这个,使用了一下和看了源码以后..我觉得这个东西以后一定会大火。 chilitags(github地址:https://github.com/chili-e 阅读全文
posted @ 2016-07-22 20:26 亦轩Dhc 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 一、摘要 了解CNN必读的一篇论文,有些东西还是可以了解的。 二、结构 1、 Relu的好处: 1、在训练时间上,比tanh和sigmod快,而且BP的时候求导也很容易 2、因为是非饱和函数,所以基本不会出现梯度消失的情况 Relu只要控制好learing rate,可以说是完胜之前的激活函数,也因 阅读全文
posted @ 2016-07-21 21:16 亦轩Dhc 阅读(4423) 评论(0) 推荐(0) 编辑
摘要: 前几天老大给了个任务,让我帮slam组写一个基于深度摄像头的障碍物检测,捣鼓了两天弄出来了,效果还不错,就在这里记一下了。 代码的核心思路是首先通过二值化,将一米之外的安全距离置零不考虑,然后通过开运算去除掉一些噪点(这个后来发现不一定有必要),在求出所有障碍物的凸包,这个时候要计算面积,当面积小于 阅读全文
posted @ 2016-07-20 10:26 亦轩Dhc 阅读(21393) 评论(2) 推荐(1) 编辑
摘要: 这是个06年的老文章了,但是很多地方还是值得看一看的. 一、概要 主要讲了CNN的Feedforward Pass和 Backpropagation Pass,关键是卷积层和polling层的BP推导讲解。 二、经典BP算法 前向传播需要注意的是数据归一化,对训练数据进行归一化到 0 均值和单位方差 阅读全文
posted @ 2016-07-06 12:48 亦轩Dhc 阅读(3157) 评论(0) 推荐(0) 编辑
摘要: 一、Abstract综述 训练出一个CNN可以同时实现分类,定位和检测..,三个任务共用同一个CNN网络,只是在pool5之后有所不同 二、分类 这里CNN的结构是对ALEXNET做了一些改进,具体的在论文中都说了,就不再赘述了。说几个关键的地方。 1.之前在多尺度的情况下,Krizhevsky用的 阅读全文
posted @ 2016-07-05 14:17 亦轩Dhc 阅读(1974) 评论(0) 推荐(0) 编辑
摘要: CV 阅读全文
posted @ 2016-05-14 15:57 亦轩Dhc 阅读(102444) 评论(2) 推荐(5) 编辑