摘要: 3D Visual Grounding 在看到相关论文的时候,我有一种非常严重的直觉——我的博士课题大概就是做这个了,虽然还没找老师聊。 简要解释:在这个任务中,研究者的主要目标是探索如何利用图像和自然语言文本之间的语义关系,从而实现跨模态信息的理解和应用。比如,可以通过将自然语言中的描述和图像中的 阅读全文
posted @ 2023-02-17 22:34 爱和九九 阅读(1518) 评论(4) 推荐(0)