随笔档案「2024年10月23日」：OpenPSG：离AGI再进一步，首个开放环境关系... - 晓飞的算法工程笔记

2024年10月23日

摘要：全景场景图生成（PSG）的目标是对对象进行分割并识别它们之间的关系，从而实现对图像的结构化理解。以往的方法主要集中于预测预定义的对象和关系类别，因此限制了它们在开放世界场景中的应用。随着大型多模态模型（LMMs）的快速发展，开放集对象检测和分割已经取得了重大进展，但PSG中的开放集关系预测仍然未被探阅读全文

posted @ 2024-10-23 09:30 晓飞的算法工程笔记阅读(345) 评论(0) 推荐(0)

晓飞的算法工程笔记

公告