摘要: 读论文思考的问题 论文试图解决什么问题? referring 和 grounding 是图片空间信息理解的两大方面,而以往的模型通常只关注于其中的一个方面 能否根据人类理解图片的能力,将 referring 和 grounding 的能力统一到一个模型中? 如何联合这两个任务?它们能相互促进吗? 如 阅读全文
posted @ 2023-10-27 15:35 PanSTARRS 阅读(1148) 评论(0) 推荐(0)