摘要: VGSG: Vision-Guided Semantic-Group Network for Text-based Person Search (链接:https://arxiv.org/abs/2311.07514) 1. 网络架构 1. CLIP baseline 基于文本的行人重识别最大的问题 阅读全文
posted @ 2024-03-10 16:47 yiranxie233 阅读(57) 评论(0) 推荐(0)