08 2016 档案
摘要:一、概述 Nvidia提出的一种基于3DCNN的动态手势识别的方法,主要亮点是提出了一个novel的data augmentation的方法,以及LRN和HRn两个CNN网络结合的方式。 3D的CNN主要是使用了三维的卷积核去处理视频序列,是视频分析中常用的方法之一。 这里是可以识别手语这种动态连续
阅读全文
摘要:一、概述 这个是最近的核心工作了,基本上都是靠着这篇paper的model过日子了啊.. 论文主要讲的是hand gesture recognition,实际上是用googlenet做的一个classification的工作,他的工作也就是在googlenet上做了fine-tuning,那么论文的
阅读全文
摘要:一、概述 这是我在做手势识别的时候,在解决手势画面提取的时候看的一篇paper,这里关键是使用了动态规划来作为跟踪算法,效果是可以比拟cameshift和kf的,但在occlusion,gaps或者离线tracking的时候做的很好。 二、算法步骤 step1:对于时间的t的frame如X_t的每个
阅读全文
摘要:终于来到了最终的大BOSS,卷积神经网络~ 这里我想还是主要关注代码的实现,具体的CNN的知识点想以后在好好写一写,CNN的代码关键就是要加上卷积层和池话层. 一、卷积层 卷积层的前向传播还是比较容易的,我们主要关注的是反向传播,看下图就知道了: 和http://www.cnblogs.com/to
阅读全文
摘要:一、参数更新策略 1.SGD 也就是随机梯度下降,最简单的更新形式是沿着负梯度方向改变参数(因为梯度指向的是上升方向,但是我们通常希望最小化损失函数)。假设有一个参数向量x及其梯度dx,那么最简单的更新的形式是: x += - learning_rate * dx 其中learning_rate是一
阅读全文
摘要:第二个作业难度很高,但做(抄)完之后收获还是很大的.... 一、Fully-Connected Neural Nets 首先是对之前的神经网络的程序进行重构,目的是可以构建任意大小的全连接的neural network,这里用模块化的思想构建整个代码,具体思路如下: 在上面的思想指导下,要求实现下面
阅读全文
摘要:第一种方法是测试批量图片,使用caffe.bin即可,首先要做的是把你的jpg图片转换为LMDB的格式,如何转换呢?用/build/tools/convert_image --resize_width 227 --resize_height 227 图片所在的目录 class.txt LMDB文件生
阅读全文
摘要:CS231n的课后作业非常的好,这里记录一下自己对作业一些笔记。 一、第一个是KNN的代码,这里的trick是计算距离的三种方法,核心的话还是python和machine learning中非常实用的向量化操作,可以大大的提高计算速度。 二、softmax 同样是需要完成naive和vector的两
阅读全文

浙公网安备 33010602011771号