哪有什么岁月静好,不过是有人替你负重前行!

文章分类 -  弱监督动作定位与检测

摘要:摘要 弱监督时间动作定位的目的是定位动作的时间边界,同时只使用视频级的类别标签来识别动作的类别。许多现有的方法试图生成伪标签来弥补分类和定位之间的差异,但通常只使用有限的上下文信息来生成伪标签。为了缓解这一问题,我们提出了一个代表性片段抽取和传播框架。我们的方法试图挖掘每个视频中的代表性片段,以便在 阅读全文
posted @ 2023-05-22 18:12 Lhiker 阅读(202) 评论(0) 推荐(0)
摘要:摘要 弱监督时间动作定位的目的是在未修剪的视频中定位动作区域并识别动作类别,仅以视频级标签作为监督信息。伪标签生成是解决具有挑战性问题的一种很有前途的策略,但现有的大多数方法都局限于使用片段级分类结果来指导生成,而忽略了视频的自然时间结构也可以提供丰富的信息来辅助生成过程。本文提出了一种基于片段特征 阅读全文
posted @ 2023-05-13 17:13 Lhiker 阅读(256) 评论(0) 推荐(0)
摘要:摘要 由于缺乏时间标注,当前的弱监督时间动作定位方法通常陷入over-complete或不完全定位。在本文中,我们旨在从两个方面来利用文本信息来提升WTAL,即:(a)判别目标,扩大类间差异,从而减少over-complete;(b)生成目标,增强类内完整性,从而找到更完整的时间边界。针对判别目标, 阅读全文
posted @ 2023-05-13 15:06 Lhiker 阅读(224) 评论(0) 推荐(0)
摘要:摘要 弱监督时间动作定位(WTAL)的目的是对只有视频级别标签的未修剪视频中的动作实例进行分类和定位。现有方法通常直接使用从预训练的提取器中提取到的片段级RGB和光流特征。由于片段的时间跨度短和初始特征不合适这两个方面的限制,这些WTAL方法缺乏对时间信息的有效利用,性能有限。在本文中,我们提出了时 阅读全文
posted @ 2023-05-11 19:41 Lhiker 阅读(237) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:ICCV2021(2021.8.11) 摘要 我们要解决的问题是,在训练中,每个动作实例只使用一个帧标签来定位动作的时间间隔。由于标签稀疏性,现有的工作无法学习动作的完整性,导致动作预测零 阅读全文
posted @ 2023-03-23 21:00 Lhiker 阅读(127) 评论(0) 推荐(0)
摘要:摘要 我们的目标是弱监督动作定位(WSAL)任务,在模型训练过程中只有视频级的动作标签可用。尽管近年来取得了一些进展,但现有的方法主要遵循于通过优化视频级分类目标来实现定位的方式,这些方法大多忽略了视频之间丰富的时序对比关系,因此在分类学习和分类-定位自适应的过程中面临着极大的模糊性。本文认为通过考 阅读全文
posted @ 2022-08-19 20:02 Lhiker 阅读(296) 评论(0) 推荐(0)
摘要:摘要 现有的时序动作检测(temporal action detection, TAD)方法依赖于包含片段级标注的大量训练数据,在推断时只能识别之前看到的类别。为每个感兴趣的类收集和注释大型训练集是昂贵的,因此是不可伸缩的。Zero-shotTAD (ZS-TAD)解决了这一障碍,它使预训练模型能够 阅读全文
posted @ 2022-08-11 16:15 Lhiker 阅读(674) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:ICCV2021(2021.8.14) 摘要 作为高级视频理解的一项挑战性任务,弱监督时间动作定位越来越受到人们的关注。由于只有视频注释,大多数现有方法寻求通过由分类进行定位的框架来处理这 阅读全文
posted @ 2022-08-02 21:00 Lhiker 阅读(333) 评论(0) 推荐(0)
摘要:0.前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督动作定位 发表时间:ICCV2021(2020.12.11) 摘要 这项工作提出了一个弱监督的时序动作定位框架,称为D2-Net,它致力于利用视频级监督在时间上定位动作。我们的主要贡献是引入了一种新的损失公式,它联 阅读全文
posted @ 2022-07-29 16:20 Lhiker 阅读(437) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv code 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:ECCV2020(2020.10.22) 摘要 弱监督时间动作定位(W-TAL)旨在仅在视频级监督下对未剪辑视频中的所有动作示例进行分类和定位。然而,在没有帧级注释的情况下,W-TAL方法很难 阅读全文
posted @ 2022-06-14 11:10 Lhiker 阅读(259) 评论(0) 推荐(0)
摘要:弱监督动作定位中相邻凸组合一致性 0.前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:arxiv 2022(2022.5.1) 摘要 在弱监督时间动作定位(WS-TAL)中,这些方法通常遵循“分类定位”过程,该过程使用片段预测来形成视频类分数 阅读全文
posted @ 2022-05-27 16:30 Lhiker 阅读(116) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:arxiv 2021, submitted to Tip(2021.4.7) 摘要 弱监督时间动作定位的目的是定位动作示例的时间边界,并仅用视频级别的标签识别相应的动作类别。传统的方法主要 阅读全文
posted @ 2022-05-16 20:24 Lhiker 阅读(529) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序行为定位 发表时序:WACV2020(2020.2.4) 摘要 提出了一种基于图卷积的弱监督动作定位方法。为了找到和分类对应于相关动作类别的视频时序段,系统必须能够识别每个视频中的区别性时序段,并识别每个动作 阅读全文
posted @ 2022-04-25 15:55 Lhiker 阅读(148) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:TPAMI 2021(2021.11.24) 摘要-弱监督时间动作定位的目的是从视频级标签中学习实例级动作模式,其中一个重大挑战是动作上下文混淆。为了克服这一挑战,最近的一项工作构建了一个 阅读全文
posted @ 2022-04-11 15:41 Lhiker 阅读(282) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv code 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:ECCV 2020(2020.3.15) 摘要 在本文中,我们研究了一种用于时间动作定位(TAL)的中间监督形式,即单帧监督。为了获得单帧监督,标注者被要求在动作的时间窗口内仅识别单个帧。这可 阅读全文
posted @ 2022-04-08 20:08 Lhiker 阅读(252) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv code 论文解读 论文基本信息: 领域:弱监督时序动作定位 发表时间:arxiv 2021(2021.5.10) 摘要-弱监督动作定位是一项具有挑战性的任务,有着广泛的应用,其目的是识别动作和相应的时间间隔,只有视频级别的注释可用。该文分析了动作的顺序敏感和位置 阅读全文
posted @ 2022-04-02 16:20 Lhiker 阅读(158) 评论(0) 推荐(0)
摘要:摘要 弱监督时间动作定位旨在学习仅使用视频级别标签检测动作类的时间间隔。为此,将动作类的帧与背景帧(即不属于任何动作类的帧)分离是至关重要的。在本文中,我们对背景帧提出了一种新的观点,在这种背景帧中,由于背景帧的不一致性,背景帧被建模为分布外样本。然后,可以通过估计每个帧来自外分布的概率(称为不确定 阅读全文
posted @ 2022-03-29 19:36 Lhiker 阅读(285) 评论(0) 推荐(0)
摘要:摘要 弱监督时序动作定位的目标是在只有视频级标签的未修剪视频中定位动作。目前,大多数最先进的WSTAL方法遵循多示例学习(MIL)流程:首先生成片段级预测,然后聚合到视频级预测。然而,我们认为现有的方法忽略了两个重要的缺点:1)运动信息的使用不足,2)普遍存在的交叉熵训练损失的不兼容性。在本文中,我 阅读全文
posted @ 2022-03-18 16:01 Lhiker 阅读(250) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github(非官方) 论文解读 论文基本信息: 领域:弱监督时序行为定位 发表时间:AAAI 2022(2021.12.21) 摘要 在未修剪的视频中,弱监督的时间动作定位(WTAL)已经成为一项实际但具有挑战性的任务,因为只有视频级别的标签可用。现有方法通常利 阅读全文
posted @ 2022-03-07 18:00 Lhiker 阅读(374) 评论(0) 推荐(0)
摘要:0. 前言 相关资料: arxiv github 论文解读 论文基本信息: 领域:时序行为定位 发表时间:ICCV2019(2019.8) 摘要 我们描述了一种潜在的方法,该方法学习在给定训练视频的长序列中检测动作,并且只使用整个视频类标签。我们的方法在弱监督学习中利用了两个创新来建立注意模型。首先 阅读全文
posted @ 2022-03-05 13:23 Lhiker 阅读(266) 评论(0) 推荐(0)