12 2020 档案
摘要:文章提出了StarGAN v2,这是一种可以同时解决生成图像多样性和多域扩展性的单一框架。相比于了baselines,它取得了明显的提升。文章对StarGAN 取得的视觉质量、多样性以及可扩展性都进行了验证。
阅读全文
摘要:这项工作设计了一项训练策略,允许从描述目标对象的一组视图产生高级知识。我们提出了Views Knowledge Distillation (VKD),将这种visual variety (视觉多样性)固定为teacher-student框架中的监督信息号,其中老师教育观察较少视图的学生。结果,学生不仅在表现在超过了老师,还在image-to-video任务中成为了SOTA。
阅读全文
摘要:针对现有工作中存在的错误伪标签问题,文章通过优化样本间的相似性度量和伪标签置信度评估策略来改善这个问题,从而提供模型性能。具体地,文章提出了方差置信度的概念,并设计了方差二次采样算法将方差置信度和距离置信度结合起来作为采样准则,同时还提出了方差衰减策略来更好了优化选择出来的伪标签样本。最终,该方法将MARS数据集上的mAP和Rank1分别提高了 3.94%和4.55%。
阅读全文
摘要:文章提出了一种新的三元组损失 HSoften-Triplet-Loss,在处理one-shot Re-ID任务中的噪声伪标签样本方面非常强大。文章还提出了一种伪标签采样过程,确保了在保持高可靠性的同时为训练图像形成正对和负对的可行性。与此同时,文章采用对抗学习网络,为训练集提供更多具有相同ID的样本,从而增加了训练集的多样性。 实验表明,文章框架在Market-1501(mAP 42.7%)和DukeMTMC-Reid数据集(mAP 40.3%)取得了最先进的Re-ID性能。
阅读全文

浙公网安备 33010602011771号