[Thu, 9 Jul 2015 ~ Tue, 14 Jul 2015] Deep Learning in arxiv

这一期的神作论文有蛮多的,都很有意思。

Feature Representation In ConvolutionalNeural Networks


该论文中论述了在某种CNN结构下,是否有准确率较高的off model的分类方法(这里是指非softmax)能达到更有效的分类结果呢?

论文给出了肯定的答案。


该论文还给出了各层特征重要性的图表,蛮有意思的


该论文还交代了实验中用到的开源码。

 

 

Towards Good Practices for Very DeepTwo-Stream ConvNets


Openmpi for multi-gpu

Code: https://github.com/yjxiong/caffe/tree/action_recog


Two-Stream Convolutional Networks forAction Recognition in Videos


 

 

当中单个stream的准确率例如以下:


Combine的结果例如以下:

 

 

 

Understanding Intra-Class Knowledge InsideCNN


该论文利用可视化技术表述了cnn是怎样进行类内区分的

另外在该文中也有引用到利用可视化表述cnn怎样进行类间区分的。

是非常好的一篇cnn可视化理解文章

COMPRESSING DEEP CONVOLUTIONAL NETWORKSUSING VECTOR QUANTIZATION


该论文描写叙述了手机级别的模型存储压缩,很好的一篇论文。

事实上模型參数的压缩不仅会起到存储空间压缩(PQ)的作用。还会起到加速模型的作用比如SVD。

 

 

Unconstrained Facial Landmark Localizationwith Backbone-Branches Fully-Convolutional Networks


论文提出了Backbone-Branches Fully-Convolutional Neural Network (BB-FCN)的网络结构,非常有趣,论文中还给出了非常多商业非商业的方法做比較,是一篇非常好的人脸定位切入文章。

当中的网络结构例如以下:


结果对照表格:


 

 

Facial Landmark Detection by DeepMulti-task Learning


多任务学习能够提高某单一任务的精度。
posted @ 2017-08-03 09:43  llguanli  阅读(232)  评论(0编辑  收藏  举报