随笔分类 -  论文阅读

摘要:Overcoming Language Priors with Self-supervised Learningfor Visual Question Answering Abstract 大多数可视化问答(VQA)模型都是从语言先验问题出发的,而语言先验问题是由固有的数据偏差引起的。具体来说,vq 阅读全文
posted @ 2021-07-26 18:41 BONiii 阅读(627) 评论(0) 推荐(0)
摘要:Check It Again: Progressive Visual Question Answeringvia Visual Entailment Abstract 虽然复杂的视觉问答模型取得了显着的成功,但它们往往只根据问题和答案之间的表面相关性来回答问题。 最近已经开发了几种的方法来解决这个语 阅读全文
posted @ 2021-07-22 20:52 BONiii 阅读(442) 评论(0) 推荐(0)
摘要:Counterfactual VQA: A Cause-Effect Look at Language Bias Abstract VQA模型可能倾向于依赖语言偏见作为切入点,因此无法从视觉和语言两个方面充分学习多模态知识。最近提出了一种在推理过程中排除语言先验的借记方法。然而,他们未能从整体上理清 阅读全文
posted @ 2021-07-19 21:19 BONiii 阅读(1718) 评论(0) 推荐(0)
摘要:Don’t Take the Easy Way Out:Ensemble Based Methods for Avoiding Known Dataset Biases Abstract 最先进的模型通常利用数据中的表面模式,这些模式不能很好地泛化到域外或对抗性设置中。 例如,文本蕴涵模型经常学习特 阅读全文
posted @ 2021-07-19 17:15 BONiii 阅读(469) 评论(0) 推荐(0)
摘要:RUBi: Reducing Unimodal Biasesfor Visual Question Answering Abstract 视觉问答(VQA)是回答有关图片的问题的任务。一些VQA模型通常利用单峰偏差来提供正确的答案,而不使用图像信息。因此,当对训练集分布之外的数据进行评估时,它们的性 阅读全文
posted @ 2021-07-13 17:06 BONiii 阅读(654) 评论(0) 推荐(0)
摘要:Counterfactual Samples Synthesizing for Robust Visual Question Answering 论文链接:https://arxiv.org/abs/2003.06576v1 1 先前VQA模型中存在的缺陷 先前的VQA模型往往捕捉到训练集中的表面语 阅读全文
posted @ 2021-07-10 14:57 BONiii 阅读(488) 评论(0) 推荐(0)
摘要:Answer Questions with Right Image Regions: A Visual Attention Regularization Approach 之前模型存在的问题 尽管现有的 VQA 模型已经从视觉注意力中受益很多,但一个紧迫的问题在于缺乏视觉基础的指导。 这通常会导致视 阅读全文
posted @ 2021-06-23 15:50 BONiii 阅读(190) 评论(0) 推荐(0)
摘要:Underwater object detection using InvertMulti-Class Adaboost with deep learning 文章介绍 作者根据水下目标检测的特殊性:波长的吸收和散射会显著降低水下图像的质量。直接导致能见度下降、对比度弱、 颜色变化,使得其目标很难被 阅读全文
posted @ 2021-06-18 10:31 BONiii 阅读(267) 评论(0) 推荐(0)
摘要:LPF: A Language-Prior Feedback Objective Function forDe-biased Visual Question Answering 相关工作 作者介绍了之前消除语言偏见模型,其主要分为两种: annotation-based methods non-an 阅读全文
posted @ 2021-06-18 10:18 BONiii 阅读(266) 评论(0) 推荐(0)