摘要:主要思想 将视频序列分为时间一致性特征和时间动作特征,且认为时间一致特征对Reid帮助更大。另外随机增加一些时间动作的 噪音,使得网络更多学到一致性特征。 不同于其他视频任务,reid更关注动作的主体,而不是动作。 时间动作线索通常会带来类内噪音例如姿势的改变特别是在聚合阶段。 这里作者个video
阅读全文
摘要:贡献: 3d卷积代替2d卷积 使用non-loca明确l处理不对齐问题(apm通过与相邻帧类似nonlocal 的操作也解决了不对齐)并捕获空时长范围依赖,注意但是没处理遮挡 引言里: 基于视频的识别包括提取特征和融合特征两部分 融合特征包括池化,rnn,以及注意力三种如下图。 这里rnn的缺点是:
阅读全文
摘要:这里试着把他的网络改成3d卷积加nolocal看效果会不会更好。 或者把stcnet加到其他网络里看看效果。 主要是用来做数据增强的。 STCnet 明确处理部分遮挡问题,通过空间结构和时间信息两部分来重建。重建部分用的都是autoencode。 最近的办法(2019)通常使用注意力来提取最显著的部
阅读全文
摘要:整体结构如下图 考虑了不同patch在所有帧上的关系,以及每一帧上的patch关系(结构) 因为对图还不是很了解(下面先直接总结论文) Patch graph construction 每对节点间的关系 允许我们动态的选择和学习不同patch的关系(这里的patch指的 是把特征图切块并池化后的一个
阅读全文
摘要:主旨:用空间注意力和时间注意力来解决遮挡和不对齐问题 自动地发现不同部位的注意力(即训练多个注意力模块) 不会受遮挡和不对齐影响(这里是因为时间上的注意力模块会自动择优(权值大的)) 可以这么理解:先在空间维度注意力,然后再在各个部件维度的注意力,所以就不需要考虑对齐和遮挡问题了。 以前基于视频的方
阅读全文