随笔档案「2022年1月」 - 为红颜

TSM: Temporal Shift Module for Effificient Video Understanding

摘要：1. 摘要视频流的爆炸性增长给在高精度和低计算成本下执行视频理解带来了挑战。传统的二维神经网络计算成本很低，但不能捕获时间关系；基于3DCNN的方法可以获得良好的性能，但计算量密集，部署成本高昂。该文提出了一种通用、高效的时移模块(TSM)。具体来说，它可以达到3DCNN的性能，但又保持了2DCN 阅读全文

posted @ 2022-01-31 22:53 为红颜阅读(771) 评论(0) 推荐(0)

Accurate Image Super-Resolution Using Very Deep Convolutional Networks(VDSR)

摘要：摘要该方法使用了一个非常深的卷积网络，灵感来自于Imagenet分类。该论文发现，网络深度的增加显示了精度的显著提高。最终的模型使用了20个权重层。通过在深度网络结构中多次级联小滤波器，有效地利用了大图像区域上的上下文信息。然而，在非常深的网络中，收敛速度成为训练过程中的一个关键问题。该文提出了一阅读全文

posted @ 2022-01-15 09:12 为红颜阅读(441) 评论(0) 推荐(0)

matlab与python对h5py文件读取顺序

摘要：matlab与python对于同一个h5py文件的读取顺序相反。诸如对train.h5。 matlab data=h5read('train.h5','/data'); label=h5read('train.h5','/label'); size(data) size(label) 结果： an 阅读全文

posted @ 2022-01-15 09:07 为红颜阅读(316) 评论(0) 推荐(0)

关于l2范数正则化与高斯先验问题

摘要：前言我们展示了如何用于分类的正则化可以从MDL的角度看作是一个高斯先验的权重。我们考虑了传输分类标签的问题；我们选择了非常精确的逻辑回归作为模型类，其中我们为每个特征指定了一个权重。这是不现实的，因为任何这样的模型的编码长度都是无限的，但如果我们对权值使用高斯先验并忽略常数因子，我们发现编码长度目阅读全文

posted @ 2022-01-13 11:37 为红颜阅读(215) 评论(0) 推荐(0)

AdderSR

摘要：1. 摘要该文利用加法器神经网络(AdderNets)研究了单幅图像的超分辨率问题。与卷积神经网络相比，AdderNets利用加法来计算输出特征，从而避免了传统乘法的大量能耗。然而，由于计算范式的不同，很难将addernet在大规模图像分类上的成功直接继承到图像超分辨率任务中。具体来说，加法器操作阅读全文

posted @ 2022-01-12 23:28 为红颜阅读(244) 评论(0) 推荐(0)

AdderNet

摘要：简要与简单的加法运算相比，乘法运算具有更高的计算复杂度。深度神经网络中广泛使用的卷积正好是来度量输入特征和卷积滤波器之间的相似性，这涉及浮点值之间的大量乘法。现在作者提出了加法网络(AdderNets)来交换深度神经网络中的这些大规模乘法，特别是卷积神经网络(CNNs)，以获得更简易的加法以降低计阅读全文

posted @ 2022-01-12 11:12 为红颜阅读(156) 评论(0) 推荐(0)

SRCNN

摘要：1. introduction 考虑了一个卷积神经网络，它可以直接学习低分辨率和高分辨率图像之间的端到端映射。我们的方法与现有的基于外部实例的外部方法有根本的不同，因为我们的方法没有明确地学习字典[41]、[49]、[50]或流形[2]、[4]。这些都是通过隐藏层隐式地实现的。此外，斑块的提取和聚合阅读全文

posted @ 2022-01-10 02:04 为红颜阅读(401) 评论(0) 推荐(0)

SSIM

摘要：1. Abstract 传统上，评估感知图像质量的客观方法试图利用人类视觉系统的各种已知属性来量化扭曲图像和参考图像之间的误差的可见性（差异）。在假设人类视觉感知高度适应于从场景中提取结构信息的情况下，我们引入了另一种基于结构信息退化的质量评估补充框架。作为这个概念的一个具体例子，我们开发了一个结构阅读全文

posted @ 2022-01-06 12:10 为红颜阅读(792) 评论(0) 推荐(0)

On Rate Distortion Optimization Using SSIM

摘要：率失真优化在现代视频编解码器中被广泛应用于各种编码器决策，以优化速率失真的权衡。通常，使用的失真测量要么是平方和误差(SSE)，要么是绝对和距离(SAD)，这两者在使用时都很方便，但并不总是反映感知视觉质量。我们希望解决相同的RDO问题，但使用一个感知动机的失真度量，如SSIM。 1.SSIM 在假阅读全文

posted @ 2022-01-01 17:09 为红颜阅读(492) 评论(0) 推荐(0)

一笑为红颜

01 2022 档案

公告