随笔分类 - 论文推介
摘要:1. Motivation and framework 当前基于CNN的高光谱图像修复取得了非常大的进展,但是仍然存在如下两个问题: the trained model is limited to the model-driven noise simulation process and may g
阅读全文
摘要:代码地址:https://github.com/haoyuc/A2N 1、Motivation 注意力机制在超分辨率领域应用较多,作者提出两个问题: What feature will attention layer strengthen? Is attention always effective
阅读全文
摘要:论文:Robust and generalizable visual representation learning via random convolutions, ICLR 2021 代码:https://github.com/tourdeml/robust-representation-ran
阅读全文
摘要:论文:【CVPR2021】Image super-resolution with non-local sparse attention 代码:https://github.com/HarukiYqM/Non-Local-Sparse-Attention 对于超分辨率应用,non-local atte
阅读全文
摘要:今天在极市平台第78期线上直播听了哈工大田春伟博士的报告《基于卷积神经网络的图像复原研究》,有三个工作比较有趣,记录一下: 1、 基于双路径卷积神经网络的图像去噪 Chunwei Tian, Yong Xu, Wangmeng Zuo. Image denoising using deep CNN
阅读全文
摘要:论文:https://arxiv.org/pdf/2101.04342.pdf 代码:https://github.com/yuhao318/mwh 1、Motivation 论文指出当前 Mixup 算法存在的两个问题:1) Require more epochs to converge. 在Im
阅读全文
摘要:Mixup 发表于 ICLR 2018,是一种用于数据增强的算法,通过将不同类之间的样本混合,从而实现训练数据的扩充。 算法的实现方式非常简单,如下: \[ \hat{x}=\lambda x_i + (1-\lambda) x_j \] \[ \hat{y}=\lambda y_i + (1-\l
阅读全文
摘要:MobileNetV2: Inverted Residuals and Linear Bottlenecks, CVPR 2018. 谷歌公司 MobileNet V1 结构非常简单, 发明了 Depthwise 和 Pointwise 卷积,但是没有使用RestNet里的residual lear
阅读全文
摘要:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications, 2017 谷歌公司 ResNet,网络已经达到152层,模型大小动辄300MB+。巨大的存储和计算开销,严重限制了CNN在手机端的应
阅读全文
摘要:论文题目:Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 【ICCV 2017】 AdaIN 的公式如下: \(\textrm{AdaIn}(x,y) = \sigma(y)\left(\frac{
阅读全文
摘要:论文:https://arxiv.org/pdf/2102.00240.pdf 代码:https://github.com/wofmanaf/SA-Net 当前的 CNN 中的 attention 机制主要包括:channel attention 和 spatial attention,当前一些方法
阅读全文
摘要:ShuffleNet V1 是旷视科技的张翔雨提出的一种适用于移动设备的轻量化网络。 Xception,ResNeXt,MobileNet 等网络都使用了 group conv,他们有一个问题,是采用了密集的1x1 pointwise conv,这一步需要相当大的计算量。为此,作者指出,一个非常自然
阅读全文
摘要:论文:https://arxiv.org/pdf/2009.09238.pdf 代码:https://github.com/tsingqguo/efficientderain 对于图像去雨任务,作者指出当前方法的问题:1)the rain model assumptions adopted by m
阅读全文
摘要:论文:https://arxiv.org/abs/2101.03697 代码:https://github.com/DingXiaoH/RepVGG RepVGG是一种新颖的CNN设计范式,它将ACNet的思想与VGG架构进行了巧妙的结合,将plain模型的精度在ImageNet上提升到了超过80%
阅读全文
摘要:论文:https://arxiv.org/abs/2001.10291 代码:https://github.com/JimmyChame/SADNet 当前基于CNN的图像去噪方法取得很大进展,但是 Traditional CNN can use only the features in local
阅读全文
摘要:论文:https://arxiv.org/abs/1911.08670 代码:https://github.com/haamoon/mmtm 多模态数据融合时,一般包括:early fusion, late fusion, intermediately 三种,如下图所示。神经科学指出,mid-lev
阅读全文
摘要:论文:https://arxiv.org/abs/2003.10985 代码:https://github.com/kuihua/MSPFN 论文指出当前图像去雨方法的问题是:their single-scale frameworks can hardly capture the inherent
阅读全文
摘要:论文:https://arxiv.org/abs/2010.15689 代码:https://github.com/lifengshiwo/DIN 1. Introduction 作者提出当前图像修复方法中非常关键的问题是:Hierarchical features under different
阅读全文
摘要:随着CNN在手机终端部署的越来越多,很多研究人员在研究如何降低神经网络的计算量。同时,大家都观察到一个现象,feature map 中的冗余是 CNN 的重要特点。 下图是 ResNet50 中的 feature map,可以看到很多的 feature map 是很相似的,比如图中标出的红、绿、蓝三
阅读全文
摘要:主要内容来自于 北京航空航天大学 刘偲 老师在 CSIG 云讲堂的报告《跨模态智能分析》 人物交互关系检测:Parallel point detection and matching 近年来,在目标检测和识别领域取得了较大进展。 但是,要了解场景中的情况,还需要认识到人类如何与周围物体互动。比如下面
阅读全文