随笔分类 - 论文阅读
摘要:Overcoming Language Priors with Self-supervised Learningfor Visual Question Answering Abstract 大多数可视化问答(VQA)模型都是从语言先验问题出发的,而语言先验问题是由固有的数据偏差引起的。具体来说,vq
阅读全文
摘要:Check It Again: Progressive Visual Question Answeringvia Visual Entailment Abstract 虽然复杂的视觉问答模型取得了显着的成功,但它们往往只根据问题和答案之间的表面相关性来回答问题。 最近已经开发了几种的方法来解决这个语
阅读全文
摘要:Counterfactual VQA: A Cause-Effect Look at Language Bias Abstract VQA模型可能倾向于依赖语言偏见作为切入点,因此无法从视觉和语言两个方面充分学习多模态知识。最近提出了一种在推理过程中排除语言先验的借记方法。然而,他们未能从整体上理清
阅读全文
摘要:Don’t Take the Easy Way Out:Ensemble Based Methods for Avoiding Known Dataset Biases Abstract 最先进的模型通常利用数据中的表面模式,这些模式不能很好地泛化到域外或对抗性设置中。 例如,文本蕴涵模型经常学习特
阅读全文
摘要:RUBi: Reducing Unimodal Biasesfor Visual Question Answering Abstract 视觉问答(VQA)是回答有关图片的问题的任务。一些VQA模型通常利用单峰偏差来提供正确的答案,而不使用图像信息。因此,当对训练集分布之外的数据进行评估时,它们的性
阅读全文
摘要:Counterfactual Samples Synthesizing for Robust Visual Question Answering 论文链接:https://arxiv.org/abs/2003.06576v1 1 先前VQA模型中存在的缺陷 先前的VQA模型往往捕捉到训练集中的表面语
阅读全文
摘要:Answer Questions with Right Image Regions: A Visual Attention Regularization Approach 之前模型存在的问题 尽管现有的 VQA 模型已经从视觉注意力中受益很多,但一个紧迫的问题在于缺乏视觉基础的指导。 这通常会导致视
阅读全文
摘要:Underwater object detection using InvertMulti-Class Adaboost with deep learning 文章介绍 作者根据水下目标检测的特殊性:波长的吸收和散射会显著降低水下图像的质量。直接导致能见度下降、对比度弱、 颜色变化,使得其目标很难被
阅读全文
摘要:LPF: A Language-Prior Feedback Objective Function forDe-biased Visual Question Answering 相关工作 作者介绍了之前消除语言偏见模型,其主要分为两种: annotation-based methods non-an
阅读全文

浙公网安备 33010602011771号