机器视觉 - 随笔分类 - aoru45

[图像算法] Linemod算法研究

摘要：Linemod算法研究先了解一下大致工作流程： ref：Gradient Response Maps for Real-TimeDetection of Textureless Objects 注册过程注册过程需要提取特征点，后续滑窗的时候就值拿这些特征点在场景图上进行滑窗，而不是传统意义上的图阅读全文

posted @ 2022-10-20 19:28 aoru45 阅读(3808) 评论(1) 推荐(3)

[论文理解] Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials

摘要：Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials Intro 回顾一下经典，文章是早期像素级分类做分割效果不好的情况下，利用条件随机场建模，解决细节分割问题的一篇文章，文章主要贡献是提出了Mean Fi 阅读全文

posted @ 2021-12-23 12:23 aoru45 阅读(1310) 评论(0) 推荐(0)

[论文理解] Meta Pseudo Labels

摘要：Intro GOOGLE 21年的CVPR，提出了一种Teacher、Student都在训练中进行优化的基于伪标签的优化方法，最重要的是性能好，是目前参数量同等情况下在IMAGENET上精度最高的方法，TOP1 ACC高达90.2%。文章的贡献主要有：提出一种形式化的蒸馏方法，该方法利用伪标签同阅读全文

posted @ 2021-10-23 20:37 aoru45 阅读(4223) 评论(3) 推荐(0)

[论文理解] Understanding self-supervised and contrastive learning with "Bootstrap Your Own Latent" (BYOL)

摘要：Understanding self-supervised and contrastive learning with "Bootstrap Your Own Latent" (BYOL) Intro 主要探讨一下BYOL的问题，其他略过，文章发现了BYOL的成功似乎还是没有逃过负样本的使用，提出B 阅读全文

posted @ 2021-10-03 00:41 aoru45 阅读(682) 评论(0) 推荐(0)

[论文理解] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

摘要：Bootstrap Your Own Latent A New Approach to Self-Supervised Learning Intro 文章提出一种不需要负样本来做自监督学习的方法，提出交替更新假说解释EMA方式更新target network防止collapse的原因，同时用梯度解释阅读全文

posted @ 2021-10-02 19:57 aoru45 阅读(707) 评论(0) 推荐(0)

[论文理解] 人脸识别论文总结（一）

摘要：Face Recognition Papers Review Partial FC: Training 10 Million Identities on a Single Machine arxiv: https://arxiv.org/pdf/2010.05222v2.pdf 主要两个贡献，一是把阅读全文

posted @ 2021-10-02 19:51 aoru45 阅读(1491) 评论(0) 推荐(0)

[论文理解] Mutual Information Neural Estimation

摘要：Mutual Information Neural Estimation 互信息定义： \(I(X;Z) = \int_{X \times Z} log\frac{d\mathbb{P}(XZ)}{d\mathbb{P}(X) \otimes \mathbb{P}(Z)}d\mathbb{P}(XZ 阅读全文

posted @ 2021-10-02 19:41 aoru45 阅读(1366) 评论(0) 推荐(0)

[论文理解] Quantizing Deep Convolutional Networks For Efficient Inference A Whitepaper

摘要：Quantizing Deep Convolutional Networks For Efficient Inference A Whitepaper Question：到底加速在哪？ Nvidia官网上的一张图非对称量化 \(\begin{aligned}x_{i n t} &=\operato 阅读全文

posted @ 2021-10-02 19:38 aoru45 阅读(570) 评论(0) 推荐(0)

[论文理解] Adversarial Examples Improve Image Recognition

摘要：Adversarial Examples Improve Image Recognition 这篇文章提出了auxiliary BN来对生成对OOD样本做BN，干净对样本用原始的BN，相当于是两个BN处理。为什么非要给对抗样本单独一个BN？这样做有什么好处？解决什么问题？实际提升有多少？具体是阅读全文

posted @ 2021-10-02 19:31 aoru45 阅读(312) 评论(0) 推荐(0)

[论文理解] 半监督论文总结（一）

摘要：Semi-supervised Papers Review CatGAN arxiv：https://arxiv.org/pdf/1511.06390.pdf 主要贡献：修改原始GAN的目标函数为 1）对于有标签样本，训练判别器时直接交叉熵 2）对于无标签样本和生成样本，训练判别器时最小化无标签样阅读全文

posted @ 2021-10-02 19:25 aoru45 阅读(1125) 评论(0) 推荐(0)

[论文理解] Virtual Adversarial Training: a Regularization Method for Supervised and Semi-supervised Learning

摘要：Virtual Adversarial Training: a Regularization Method for Supervised and Semi-supervised Learning 简介本文是17年半监督学习的一篇文章，受对抗训练的启发，将对抗训练的范式用于提升半监督学习，并且取得了阅读全文

posted @ 2020-10-26 02:31 aoru45 阅读(1105) 评论(0) 推荐(0)

[论文理解] Good Semi-supervised Learning That Requires a Bad GAN

摘要：Good Semi-supervised Learning That Requires a Bad GAN 恢复博客更新，最近没那么忙了，记录一下学习。 Intro 本文是一篇稍微偏理论的半监督学习的文章，通过证明一个能够生成非目标分布的、低样本密度的样本的生成器，对半监督学习的效果有很大的提升，这阅读全文

posted @ 2020-10-06 20:50 aoru45 阅读(1631) 评论(1) 推荐(0)

[论文理解] 活体检测算法论文小结 (一)

摘要：活体检测算法本周论文阅读小结本周正式开始看活体检测方向的论文,之前两周完成了Head Pose的部署工作,后面主要负责做活体检测.本周的情况是阅读了三篇cvpr, 其中复现了2篇,实验结果还算满意,等待后续评估. Learning Generalized Spoof Cues for Face A 阅读全文

posted @ 2020-06-25 21:13 aoru45 阅读(3601) 评论(4) 推荐(1)

[学习笔记] Hebb 学习规则和Hopfield网络

摘要：Hebb 学习规则和Hopfield网络 Hebb学习规则 Hebb学习规则是Donald Hebb在1949年提出的一种学习规则，用来描述神经元的行为是如何影响神经元之间的连接的，通俗的说，就是如果相链接的两个神经元同时被激活，显然我们可以认为这两个神经元之间的关系应该比较近，因此将这两个神经元之阅读全文

posted @ 2020-03-08 16:22 aoru45 阅读(9333) 评论(0) 推荐(1)

[论文理解] Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery

摘要：Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery Intro 本文提出利用GAN来做异常检测，大致思想为，先使用正常方式训练生成器G，训练完成后固定G的参数，给定阅读全文

posted @ 2020-02-05 09:14 aoru45 阅读(3557) 评论(0) 推荐(0)

[论文理解] How much position information do convolutional neural network encode?

摘要：How much position information do convolutional neural network encode? Intro 文章是ICML2020的一个工作，探究了CNN到底有没有编码位置信息，这些位置信息在哪些神经元中被编码、这些位置信息又是如何被暴露给神经网络学习的。阅读全文

posted @ 2020-02-04 01:29 aoru45 阅读(2518) 评论(0) 推荐(0)

[论文理解] Convolution with even-sized kernels and symmetric padding

摘要：Convolution with even sized kernels and symmetric padding Intro 本文探究了偶数kernel size的卷积对网络的影响，结果表明偶数卷积在结果上并不如奇数卷积。文章从实验与原理上得出结论，偶数卷积之所以结果更差，是因为偶数卷积会使得fe 阅读全文

posted @ 2020-02-02 21:34 aoru45 阅读(1688) 评论(0) 推荐(0)

[论文理解] Destruction and Construction Learning for Fine-grained Image Recognition

摘要：Destruction and Construction Learning for Fine grained Image Recognition Intro 本文提出一种细粒度图像分类的方法，即将原图像拼图一样shuffle成不同的block，丢进一个分类器，当然，直接这样训练会引入shuffle带阅读全文

posted @ 2020-02-02 03:02 aoru45 阅读(1435) 评论(2) 推荐(0)

[论文理解] Noise2Noise: Learning Image Restoration without Clean Data

摘要：Noise2Noise: Learning Image Restoration without Clean Data Intro 本文亮点是输入图像和target图像都是有噪声的图像，而不是clean的图像，网络可以利用有噪声的图像学习到将有噪声的图像转化为无噪声的clean图像。文章解释了在使用l 阅读全文

posted @ 2020-02-01 21:38 aoru45 阅读(6772) 评论(1) 推荐(0)

[论文理解] On the "steerability" of generative adversarial networks

摘要：On the "steerability" of generative adversarial networks Intro 本文提出对GAN的latent space进行操作的一种方法，通过对latent space的编辑实现生成域外样本，操控生成样本的基本属性，如控制生成样本的位置、光照、二维旋阅读全文

posted @ 2020-01-30 23:51 aoru45 阅读(915) 评论(0) 推荐(0)

漂流，浪客

浪迹走天涯。

随笔分类 - 机器视觉

公告