摘要: StarGAN: Unified Generative Adversarial Networks for Multi Domain Image to Image Translation 重要,单开一篇笔记。 FaceID GAN: Learning a Symmetry Three Player G 阅读全文
posted @ 2018-12-10 19:25 酒精23333 阅读(1207) 评论(0) 推荐(0) 编辑
摘要: 概要 JiFeng老师CVPR2019的另一篇大作,真正地把检测和跟踪做到了一起,之前的一篇大作FGFA首次构建了一个非常干净的视频目标检测框架,但是没有实现帧间box的关联,也就是说没有实现跟踪。而多目标跟踪问题一般需要一个off the shelf的检测器先去逐帧检测,然后再将各帧的detect 阅读全文
posted @ 2018-12-06 17:35 酒精23333 阅读(1654) 评论(0) 推荐(0) 编辑
摘要: 概要 MSRA在目标检测方向Beyond Regular Grid的方向上越走越远,又一篇大作推出,相比前作DCN v1在COCO上直接涨了超过5个点,简直不要太疯狂。文章的主要内容可大致归纳如下: More dconv and Modulated donv :认为前作中卷积变形时容易采样到不好的位 阅读全文
posted @ 2018-12-03 17:19 酒精23333 阅读(2317) 评论(0) 推荐(1) 编辑
摘要: 14年9月份挂出来的文章,基本思想就是用对抗训练的方法来学习domain invariant的特征表示。方法也很只管,在网络的某一层特征之后接一个判别网络,负责预测特征所属的domain,而后特征提取器和判别器在域分类loss上对抗,同时特征提取器和lable分类器(也就是原任务中的分类器)共同优化 阅读全文
posted @ 2018-11-28 23:52 酒精23333 阅读(2751) 评论(0) 推荐(0) 编辑
摘要: 中心思想 继Relation Network实现可学习的nms之后,MSRA的大佬们觉得目标检测器依然不够fully learnable,这篇文章类似之前的Deformable ROI Pooling,主要在ROI特征的组织上做文章,文章总结了现有的各种ROI Pooling变体,提出了一个统一的数 阅读全文
posted @ 2018-11-28 23:51 酒精23333 阅读(1365) 评论(0) 推荐(0) 编辑
摘要: 主要观点:基于sliding window(SW)类的方法,如TURN,可以达到很高的AR,但定位不准;基于Group的方法,如TAG,AR有明显的上界,但定位准。所以结合两者的特长,加入Complementary Filtering(互补滤波)模块,实际上就是加一个网络预测TAG能不能搞,不能搞就 阅读全文
posted @ 2018-11-20 15:23 酒精23333 阅读(636) 评论(0) 推荐(0) 编辑
摘要: 原论文标题:Acquisition of Localization Confidence for Accurate Object Detection 1. 前言 Megvii在ECCV 2018上的一篇oral,思路非常清奇,提出了Localization Confidence(定位置信度)这一概念 阅读全文
posted @ 2018-08-06 16:42 酒精23333 阅读(662) 评论(0) 推荐(0) 编辑
摘要: 原论文标题:FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks 文章是对FlowNet的进一步改进,主要贡献为如下三个方面: 训练数据集的调度对于模型的性能有较大的影响。 PS:光流的数据集都比较小,一般需要几个数 阅读全文
posted @ 2018-07-29 19:37 酒精23333 阅读(6797) 评论(0) 推荐(0) 编辑
摘要: 两个整数的 汉明距离 指的是这两个数字的二进制数对应位不同的数量。 计算一个数组中,任意两个数之间汉明距离的总和。 示例: 注意: 两两求Hamming距离再汇总,复杂度O(n²)。 简化一下,在每个二进制位上分别统计1和0的个数os和zs,在这一位上的Hamming距离(说法不太严格)实际上就是o 阅读全文
posted @ 2018-07-23 18:04 酒精23333 阅读(169) 评论(0) 推荐(0) 编辑