哪有什么岁月静好,不过是有人替你负重前行!

12 2021 档案

摘要:显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用时间更宝贵,尽可能使模型变快(减少 flop)显存占用不是和 batch size 简单成正比,模型自身的参数及其延伸出来的数据也要占据显存batch size 越大,速度未必越快。在你充分利用计算资源的时候,加大 batc 阅读全文
posted @ 2021-12-10 21:09 Lhiker 阅读(2704) 评论(0) 推荐(0)
摘要:网上已经有大佬进行了总结,可以参考一下:CSDN 就目前来看,大多数弱监督方法的提出动力之一就是数据标注过于昂贵,模型基于MIL,主要创新点在于结合了网络做出的不确定性预测,标准的交叉熵损失会严重惩罚错误的预测,但是论文中的方法在预测结果错误但是不确定性较高时损失也不会太大,从而减小了训练误差,使得 阅读全文
posted @ 2021-12-07 18:42 Lhiker 阅读(108) 评论(0) 推荐(0)
摘要:传统异常检测的方法对阳性示例的识别,即异常视频中罕见的异常片段,在很大程度上受到优势负示例的影响,特别是当异常事件是细微的异常,与正常事件相比只有微小的差异时。为了解决这一问题,论文中引入了一种新的、理论上健全的方法,称为鲁棒时间特征幅值学习(RTFM),RTFM是基于top-k示例MIL,其最大特 阅读全文
posted @ 2021-12-07 16:33 Lhiker 阅读(720) 评论(0) 推荐(0)
摘要:作者研究了VQA模型是否能够解决GQA挑战中图像中物体之间的空间关系问题。研究结果表明,尽管模型正确地回答了其中一些问题(∼60%),但它们不能真实地解决空间关系问题,这就引出了一个问题:VQA模型是否真的理解了场景的几何形状,或者它们是否基于从数据中学习到的虚假相关性来回答空间问题?基于此,作者设 阅读全文
posted @ 2021-12-02 14:47 Lhiker 阅读(94) 评论(0) 推荐(0)