随笔分类 -  机器视觉

机器视觉笔记
摘要:平面下Homography矩阵的分解 本篇解释下平面物体的homography矩阵分解,即得到相机的位姿,来分析相机是否正确放置,在机器视觉中有着较为广泛的应用。 原理 我们已知平面内同一物体在两图像坐标系的坐标为$p_1 = (x_1, y_1)$,$p_2 = (x_2, y_2)$。 工业场景 阅读全文
posted @ 2023-02-14 16:53 aoru45 阅读(143) 评论(0) 推荐(0) 编辑
摘要:Linemod算法研究 先了解一下大致工作流程: ref:Gradient Response Maps for Real-TimeDetection of Textureless Objects 注册过程 注册过程需要提取特征点,后续滑窗的时候就值拿这些特征点在场景图上进行滑窗,而不是传统意义上的图 阅读全文
posted @ 2022-10-20 19:28 aoru45 阅读(1481) 评论(0) 推荐(1) 编辑
摘要:Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials Intro 回顾一下经典,文章是早期像素级分类做分割效果不好的情况下,利用条件随机场建模,解决细节分割问题的一篇文章,文章主要贡献是提出了Mean Fi 阅读全文
posted @ 2021-12-23 12:23 aoru45 阅读(920) 评论(0) 推荐(0) 编辑
摘要:Intro GOOGLE 21年的CVPR,提出了一种Teacher、Student都在训练中进行优化的基于伪标签的优化方法,最重要的是性能好,是目前参数量同等情况下在IMAGENET上精度最高的方法,TOP1 ACC高达90.2%。 文章的贡献主要有: 提出一种形式化的蒸馏方法,该方法利用伪标签同 阅读全文
posted @ 2021-10-23 20:37 aoru45 阅读(3214) 评论(3) 推荐(0) 编辑
摘要:Understanding self-supervised and contrastive learning with "Bootstrap Your Own Latent" (BYOL) Intro 主要探讨一下BYOL的问题,其他略过,文章发现了BYOL的成功似乎还是没有逃过负样本的使用,提出B 阅读全文
posted @ 2021-10-03 00:41 aoru45 阅读(494) 评论(0) 推荐(0) 编辑
摘要:Bootstrap Your Own Latent A New Approach to Self-Supervised Learning Intro 文章提出一种不需要负样本来做自监督学习的方法,提出交替更新假说解释EMA方式更新target network防止collapse的原因,同时用梯度解释 阅读全文
posted @ 2021-10-02 19:57 aoru45 阅读(552) 评论(0) 推荐(0) 编辑
摘要:Face Recognition Papers Review Partial FC: Training 10 Million Identities on a Single Machine arxiv: https://arxiv.org/pdf/2010.05222v2.pdf 主要两个贡献,一是把 阅读全文
posted @ 2021-10-02 19:51 aoru45 阅读(1219) 评论(0) 推荐(0) 编辑
摘要:Mutual Information Neural Estimation 互信息定义: \(I(X;Z) = \int_{X \times Z} log\frac{d\mathbb{P}(XZ)}{d\mathbb{P}(X) \otimes \mathbb{P}(Z)}d\mathbb{P}(XZ 阅读全文
posted @ 2021-10-02 19:41 aoru45 阅读(895) 评论(0) 推荐(0) 编辑
摘要:Quantizing Deep Convolutional Networks For Efficient Inference A Whitepaper Question:到底加速在哪? Nvidia官网上的一张图 非对称量化 \(\begin{aligned}x_{i n t} &=\operato 阅读全文
posted @ 2021-10-02 19:38 aoru45 阅读(423) 评论(0) 推荐(0) 编辑
摘要:Adversarial Examples Improve Image Recognition 这篇文章提出了auxiliary BN来对生成对OOD样本做BN,干净对样本用原始的BN,相当于是两个BN处理。 为什么非要给对抗样本单独一个BN?这样做有什么好处?解决什么问题? 实际提升有多少? 具体是 阅读全文
posted @ 2021-10-02 19:31 aoru45 阅读(231) 评论(0) 推荐(0) 编辑
摘要:Semi-supervised Papers Review CatGAN arxiv:https://arxiv.org/pdf/1511.06390.pdf 主要贡献: 修改原始GAN的目标函数为 1)对于有标签样本,训练判别器时直接交叉熵 2)对于无标签样本和生成样本,训练判别器时最小化无标签样 阅读全文
posted @ 2021-10-02 19:25 aoru45 阅读(792) 评论(0) 推荐(0) 编辑
摘要:Virtual Adversarial Training: a Regularization Method for Supervised and Semi-supervised Learning 简介 本文是17年半监督学习的一篇文章,受对抗训练的启发,将对抗训练的范式用于提升半监督学习,并且取得了 阅读全文
posted @ 2020-10-26 02:31 aoru45 阅读(907) 评论(0) 推荐(0) 编辑
摘要:Good Semi-supervised Learning That Requires a Bad GAN 恢复博客更新,最近没那么忙了,记录一下学习。 Intro 本文是一篇稍微偏理论的半监督学习的文章,通过证明一个能够生成非目标分布的、低样本密度的样本的生成器,对半监督学习的效果有很大的提升,这 阅读全文
posted @ 2020-10-06 20:50 aoru45 阅读(1442) 评论(1) 推荐(0) 编辑
摘要:活体检测算法本周论文阅读小结 本周正式开始看活体检测方向的论文,之前两周完成了Head Pose的部署工作,后面主要负责做活体检测.本周的情况是阅读了三篇cvpr, 其中复现了2篇,实验结果还算满意,等待后续评估. Learning Generalized Spoof Cues for Face A 阅读全文
posted @ 2020-06-25 21:13 aoru45 阅读(3255) 评论(4) 推荐(1) 编辑
摘要:Hebb 学习规则和Hopfield网络 Hebb学习规则 Hebb学习规则是Donald Hebb在1949年提出的一种学习规则,用来描述神经元的行为是如何影响神经元之间的连接的,通俗的说,就是如果相链接的两个神经元同时被激活,显然我们可以认为这两个神经元之间的关系应该比较近,因此将这两个神经元之 阅读全文
posted @ 2020-03-08 16:22 aoru45 阅读(6389) 评论(0) 推荐(1) 编辑
摘要:Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery Intro 本文提出利用GAN来做异常检测,大致思想为,先使用正常方式训练生成器G,训练完成后固定G的参数,给定 阅读全文
posted @ 2020-02-05 09:14 aoru45 阅读(3311) 评论(0) 推荐(0) 编辑
摘要:How much position information do convolutional neural network encode? Intro 文章是ICML2020的一个工作,探究了CNN到底有没有编码位置信息,这些位置信息在哪些神经元中被编码、这些位置信息又是如何被暴露给神经网络学习的。 阅读全文
posted @ 2020-02-04 01:29 aoru45 阅读(2288) 评论(0) 推荐(0) 编辑
摘要:Convolution with even sized kernels and symmetric padding Intro 本文探究了偶数kernel size的卷积对网络的影响,结果表明偶数卷积在结果上并不如奇数卷积。文章从实验与原理上得出结论,偶数卷积之所以结果更差,是因为偶数卷积会使得fe 阅读全文
posted @ 2020-02-02 21:34 aoru45 阅读(1507) 评论(0) 推荐(0) 编辑
摘要:Destruction and Construction Learning for Fine grained Image Recognition Intro 本文提出一种细粒度图像分类的方法,即将原图像拼图一样shuffle成不同的block,丢进一个分类器,当然,直接这样训练会引入shuffle带 阅读全文
posted @ 2020-02-02 03:02 aoru45 阅读(1349) 评论(2) 推荐(0) 编辑
摘要:Noise2Noise: Learning Image Restoration without Clean Data Intro 本文亮点是输入图像和target图像都是有噪声的图像,而不是clean的图像,网络可以利用有噪声的图像学习到将有噪声的图像转化为无噪声的clean图像。文章解释了在使用l 阅读全文
posted @ 2020-02-01 21:38 aoru45 阅读(5736) 评论(1) 推荐(0) 编辑