摘要: RUBi: Reducing Unimodal Biasesfor Visual Question Answering Abstract 视觉问答(VQA)是回答有关图片的问题的任务。一些VQA模型通常利用单峰偏差来提供正确的答案,而不使用图像信息。因此,当对训练集分布之外的数据进行评估时,它们的性 阅读全文
posted @ 2021-07-13 17:06 BONiii 阅读(654) 评论(0) 推荐(0)