哪有什么岁月静好,不过是有人替你负重前行!

09 2022 档案

摘要:1.针对的问题 现有的深度网络方法主要基于类激活图,只强调最具判别性的局部区域,忽略了整个目标。此外,新兴的基于transformer的技术不断强调背景,这阻碍了完整物体的识别能力。 2.主要贡献 •提出了一种再注意机制,称为token refinement transformer(TRT),它突出 阅读全文
posted @ 2022-09-29 19:24 Lhiker 阅读(178) 评论(0) 推荐(0)
摘要:1.图像生成 1.1CLIPasso(semantically-aware object sketching) 将物体的照片变成简笔画的形式,希望即使有最少的线条,也能识别出来物体。 问题定义,在纸上画几条随机初始化的曲线(bezier curve),通过不断的训练,希望这些曲线最后变成简笔画,贝兹 阅读全文
posted @ 2022-09-26 16:53 Lhiker 阅读(2060) 评论(0) 推荐(0)
摘要:看了跟李沐学AI系列朱毅老师讲的CLIP改进工作串讲,这里记录一下。 1.分割 分割的任务其实跟分类很像,其实就是把图片上的分类变成像素级别上的分类,但是往往图片上能用的技术都能用到像素级别上来。所以分割的论文很多。 1.1.LSeg(language-driven semantic segment 阅读全文
posted @ 2022-09-22 15:27 Lhiker 阅读(2249) 评论(0) 推荐(0)
摘要:1.针对的问题 为了在未修剪视频中建模时间关系,以前的多种方法使用一维时间卷积。然而,受核大小的限制,基于卷积的方法只能直接获取视频的局部信息,不能学习视频中时间距离较远的片段之间的直接关系。因此,这种方法不能模拟片段之间的远程交互作用,而这对动作检测可能很重要。 多头自注意力虽然可以对视频中的长期 阅读全文
posted @ 2022-09-02 20:26 Lhiker 阅读(274) 评论(0) 推荐(0)