摘要: 简介:这是一片发表在TPAMI上的文章,可以看见作者有余凯(是百度的那个余凯吗?)本文提出了一种3D神经网络:通过在神经网络的输入中增加时间这个维度(连续帧),赋予神经网络行为识别的功能。相应提出了一种3D卷积,对三幅连续帧用一个3D卷积核进行卷积(可以理解为用三个二维卷积核卷积三张图)。3D神经网络结构图:input—>H1 神经网络的输入为7张大小为60*40的连续帧,7张帧通过事先设定硬核(hardwired kernels)获得5种不同特征:灰度、x方向梯度、y方向梯度、x方向光流、y方向光流,5个channels一共33个maps。对于这个做法,原文这么解释“相比于随机初始化, 阅读全文
posted @ 2013-11-29 19:14 Pony_s 阅读(25291) 评论(9) 推荐(2) 编辑