哪有什么岁月静好,不过是有人替你负重前行!

05 2022 档案

摘要:1.针对的问题 之前的WS-TAL方法大多使用片段预测来形成视频类分数,然后优化视频分类损失。在此过程中,片段预测(或片段注意力权重)用于分离前景和背景。然而,片段预测通常是不准确的,因为没有帧级标签,导致整体性能受到阻碍。 2.主要贡献 •考虑到邻近片段在WS-TAL任务中的关键作用,作者提出了一 阅读全文
posted @ 2022-05-27 16:22 Lhiker 阅读(63) 评论(0) 推荐(0)
摘要:参考简书,github 0.前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:数据增强 发表时间:arxiv 2022(2022.5.1) 1.针对的问题 大型的深度神经网络存在一些不好的行为,比如记忆性和对抗样本敏感问题。当前的神经网络大多都是基于经验风险最小化(ERM原 阅读全文
posted @ 2022-05-26 20:20 Lhiker 阅读(262) 评论(0) 推荐(0)
摘要:最近看了李沐讲论文系列朱毅老师讲的I3D论文精读(视频,笔记),这里记录一下。 1.针对的问题 1.之前的视频数据集都太小,导致大多数流行的动作识别基准都很小,且即使不同模型效果有好有坏也难以区分。 2.在I3D提出之前,视频一直没有明确的前端运行架构,之前捕获时序信息的方法主要有三种。1.向模型中 阅读全文
posted @ 2022-05-20 16:42 Lhiker 阅读(1335) 评论(0) 推荐(0)
摘要:1.针对的问题 传统的方法主要侧重于前景和背景帧的分离,只有单一的注意力分支和类激活序列。然而,作者认为,除了独特的前景和背景帧外,还有大量语义模糊的动作语境帧。将这些上下文帧分组到同一个背景类是没有意义的,因为它们在语义上与特定的动作类别相关。 2.主要贡献 •与之前将视频帧仅划分为前景帧和背景帧 阅读全文
posted @ 2022-05-16 20:32 Lhiker 阅读(270) 评论(0) 推荐(0)
摘要:1.针对的问题 本文主要关注弱监督动作检测中基于注意力的方法存在的问题,作者认为,如果没有段级的ground-truth监督,注意力权重的质量会阻碍这些方法的性能。为了缓解这一问题,作者提出了一种新的不确定性引导的协作训练(UGCT)策略,该策略主要包括两个关键设计:(1)第一个设计是在线伪标签生成 阅读全文
posted @ 2022-05-05 14:41 Lhiker 阅读(234) 评论(0) 推荐(0)
摘要:1.torch.where(condition,x,y) 有两种情况: 1.包含三个参数,如果condition为true,则 value值为x; 如果condition为false,则 value值为y; 2.若只包含condition参数,若进行判断的是一个n维张量,则返回一个元组,包括n个te 阅读全文
posted @ 2022-05-03 15:14 Lhiker 阅读(346) 评论(0) 推荐(0)