MSTK - 博客园

2021年8月9日

MMDetection源码解析：Faster RCNN(7)--ConvFCBBoxHead,Shared2FCBBoxHead和Shared4Conv1FCBBoxHead类

摘要： ConvFCBBoxHead类定义在\mmdet\models\roi_heads\bbox_heads\convfc_bbox_head.py中,其作用是对共享特征层进行卷积和全连接操作,然后在forward到BBoxHead类中,而且也继承自BBoxHead类.convfc_bbox_head. 阅读全文

posted @ 2021-08-09 19:33 MSTK 阅读(1032) 评论(0) 推荐(0)

2021年7月19日

MMDetection源码解析：Faster RCNN(6)--SingleRoIExtractor类和BaseRoIExtractor类

摘要： SingleRoIExtractor类定义在\mmdet\models\roi_heads\roi_extractors\single_level_roi_extractor.py中,其作用是对ROI特征层进行特征提取,继承自BaseRoIExtractor类. import torch from 阅读全文

posted @ 2021-07-19 15:18 MSTK 阅读(1299) 评论(0) 推荐(0)

2021年7月8日

显存不足造成nan错误

摘要：用MMDetection训练过程中,全连接层(Fully Connected Layers,FC)出现nan错误,但是全连接层只是线性组合,而且数值也不大,也没有计算损失函数,怎么可能出现nan错误? 经过研究发现,原来是显存不足造成的,由于显存不足,有些tensor没有了,就造成了nan错误,进行阅读全文

posted @ 2021-07-08 21:14 MSTK 阅读(1253) 评论(0) 推荐(0)

2021年6月28日

MMDetection源码解析：Faster RCNN(5)--TwoStageDetector类

摘要： TwoStageDetector类定义在\mmdet\models\detectors\tew_stage.py中: import torch import torch.nn as nn # from mmdet.core import bbox2result, bbox2roi, build_as 阅读全文

posted @ 2021-06-28 16:11 MSTK 阅读(599) 评论(0) 推荐(0)

2021年6月10日

MMDetection源码解析：Faster RCNN(4)--AnchorHead类

摘要： RPNHead继承了AnchorHead(AnchorHead定义在mmdetection/mmdet/models/dense_heads/anchor_head.py文件里面),前面介绍的forward_single(),_get_bboxes_single(),loss()等函数都是重载的An 阅读全文

posted @ 2021-06-10 19:27 MSTK 阅读(731) 评论(0) 推荐(0)

2021年5月1日

Permission denied: 'C:\\Users\\Admin\\AppData\\Local\\Temp\\tmp06sdogpt.py'

摘要：运行时出现下面的错误: Traceback (most recent call last): File "D:/Projects/project_name/tools/train.py", line 178, in <module> main() File "D:/Projects/project_ 阅读全文

posted @ 2021-05-01 17:44 MSTK 阅读(2638) 评论(0) 推荐(0)

CUDA error: device-side assert triggered

摘要：运行时出现下面的错误: C:/cb/pytorch_1000000000000/work/aten/src/ATen/native/cuda/IndexKernel.cu:142: block: [0,0,0], thread: [17,0,0] Assertion `index >= -sizes 阅读全文

posted @ 2021-05-01 17:23 MSTK 阅读(6323) 评论(0) 推荐(0)

2021年4月14日

MMDetection源码解析：Faster RCNN(3)--RPN Head类

摘要： Faster RCNN配置文件faster_rcnn_r50_fpn.py中的 backbone=dict( type='ResNet', depth=50, num_stages=4, out_indices=(0, 1, 2, 3), frozen_stages=1, norm_cfg=dict 阅读全文

posted @ 2021-04-14 17:22 MSTK 阅读(1634) 评论(0) 推荐(0)

2021年3月29日

MMDetection源码解析：Faster RCNN(2)--FasterRCNN类

摘要： Faster RCNN配置文件faster_rcnn_r50_fpn.py中的 type='FasterRCNN', 说明了这是一个Faster RCNN模型,对应的是mmdetection/mmdet/models/detectors/faster_rcnn.py文件,主要内容如下： from . 阅读全文

posted @ 2021-03-29 17:43 MSTK 阅读(947) 评论(0) 推荐(0)

2021年2月27日

MMDetection源码解析：Faster RCNN(1)--配置文件

摘要： faster_rcnn_r50_fpn_1x_coco.py文件位于目录mmdetection/configs/faster_rcnn/下面,主要内容如下: _base_ = [ '../_base_/models/faster_rcnn_r50_fpn.py', '../_base_/datase 阅读全文

posted @ 2021-02-27 23:55 MSTK 阅读(1501) 评论(0) 推荐(0)

2021年1月21日

PyCharm取消GitHub提交

摘要： git clone的项目,用PyCharm打开以后,点击History,出来的全部是GitHub上的提交记录,这时如果点击提交,也是提交到GitHub. 要取消GitHub提交,点击File->Settings->Version Control,删除项目的Git就可以了. 阅读全文

posted @ 2021-01-21 17:59 MSTK 阅读(1953) 评论(0) 推荐(0)

2020年12月9日

D2Det: Towards High Quality Object Detection and Instance Segmentation

摘要： D2Det是一种two-stage算法,类似于Faster-RCNN,在Faster-RCNN的基础上进行了一些改进,总体框架如下图(a)所示: 和Faster-RCNN相比,改进的地方在于: 1. Dense local regression 如上图(b)所示,Faster-RCNN是对RPN提出阅读全文

posted @ 2020-12-09 15:10 MSTK 阅读(910) 评论(0) 推荐(0)

2020年12月5日

Windows下安装MMDetection

摘要： MMDetection是一个基于Pytorch实现的深度学习和目标检测代码库,包含了Faster-RCNN,YOLO,SSD等主流的目标检测算法代码和已经训练好的模型,方便我们进行目标检测算法的研究.MMDetection的安装步骤如下: 1. 创建一个Conda环境并Activate,很简单,就不阅读全文

posted @ 2020-12-05 20:27 MSTK 阅读(2157) 评论(0) 推荐(0)

2020年11月28日

RefineDet

摘要： RefineDet可以看成是SSD,RPN,FPN算法的结合,其主要思想是:Faster-RCNN等two-stage算法,对box进行两次回归,因而精度高,但是速度慢;YOLO等one-stage算法,对box只进行一个回归,速度快,但是精度低.RefineDet将两者结合起来,对box进行两次回阅读全文

posted @ 2020-11-28 16:37 MSTK 阅读(389) 评论(0) 推荐(0)

2020年10月7日

Hyperband:超参数优化

摘要： Hyperband算法的伪代码如下: R是单个超参数组合能够分配的最大资源预算,如1个epoch就是1个预算,R=81,就表示81个epoch,smax=4,B=5R=405,当s=4时,初始为81个点,每个点训练1个epoch,然后选择最好的27个点,每个点再训练3个epoch,...,直到最后只阅读全文

posted @ 2020-10-07 18:14 MSTK 阅读(1409) 评论(0) 推荐(0)

2020年10月4日

超参数贝叶斯优化

摘要：超参数(Hyper-parameter)是定义模型或者定义训练过程的参数,是相对于模型参数(Parameter)来说的,比如目标检测网络的网络结构,激活函数的选择,学习率的大小,Anchor的尺寸等等,都属于超参数.超参数对网络的性能(如目标检测网络的mAP等)有很大的影响,因此需要找到性能最优的参阅读全文

posted @ 2020-10-04 16:01 MSTK 阅读(2497) 评论(0) 推荐(0)

2020年9月15日

AssertionError: Results do not correspond to current coco set

摘要：提交COCO Detection Challenge (Bounding Box)时出现错误: WARNING: Your kernel does not support swap limit capabilities or the cgroup is not mounted. Memory lim 阅读全文

posted @ 2020-09-15 19:49 MSTK 阅读(3564) 评论(0) 推荐(0)

2020年8月30日

DIoU-NMS

摘要：和原始的NMS不同,DIoU-NMS不仅考虑了IoU的值,还考虑了两个Box中心点之间的距离,使用了新的公式决定一个Box是否被删除: 其中,RDIoU是两个Box中心点之间的距离,用下面的公式表示: 其中p(.)是距离,b和bgt表示两个box,c是包含两个box的最小box的对角线长度,如下图所阅读全文

posted @ 2020-08-30 20:38 MSTK 阅读(4596) 评论(0) 推荐(0)

2020年7月27日

OSError: [WinError 126] 找不到指定的模块。

摘要：运行下面代码时出错： net = model_zoo.get_model('faster_rcnn_resnet50_v1b_voc', pretrained=True, ctx=mx.gpu(0)) 原因是安装的mxnet版本不对，以前安装的是mxnet-cu90，换成mxnet-cu100就正常阅读全文

posted @ 2020-07-27 20:08 MSTK 阅读(3465) 评论(0) 推荐(0)

2020年6月17日

InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

摘要：安装TensorFlow 2.0.0以后,运行出现了下面的错误: tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insuffi 阅读全文

posted @ 2020-06-17 17:19 MSTK 阅读(4869) 评论(0) 推荐(0)

2020年6月16日

Tensorflow 2.0 DLL load failed: 找不到指定的模块

摘要：安装Tensorflow 2.0以后,运行 import tensorflow as tf 出现下面的错误: 原因及解决的办法:以前是用pip install tensorflow-gpu安装的,没有指定版本,删除以前安装的版本,指定版本为2.0.0-alpha0安装: pip install te 阅读全文

posted @ 2020-06-16 14:07 MSTK 阅读(1010) 评论(0) 推荐(0)

2020年5月25日

使用GluonCV运行目标检测模型

摘要： GluonCV是分布式机器学习社区(DMLC)发布的深度学习计算机视觉工具箱,提供了计算机视觉顶级的算法实现与基本运算(另一个是自然语言处理工具箱GluonNLP). GluonCV简单易用,有很多训练好的模型,通过一行代码就可以下载使用,非常方便. 由于GluonCV是基于MXNet,所以,要先安阅读全文

posted @ 2020-05-25 15:38 MSTK 阅读(1010) 评论(0) 推荐(0)

2020年5月13日

Soft-NMS: Improving Object Detection With One Line of Code

摘要：非极大值抑制(Non-Maximum Suppression,NMS)是在目标检测中广泛应用的一种方法:首先对每一个预测框给出一个分类和置信度,对每一类的框,按照置信度从小到大排序;然后选中置信度最大的框,依次和前面的同类框计算IOU,对于IOU大于阈值的框,就直接删除掉（也可以理解成将这些框的置信阅读全文

posted @ 2020-05-13 18:08 MSTK 阅读(731) 评论(0) 推荐(0)

2020年4月30日

Python中List的排序

摘要： Python对List的排序主要有两种方法:一种是用sorted()函数,这种函数要求用一个变量接收排序的结果,才能实现排序;另一种是用List自带的sort()函数，这种方法不需要用一个变量接收排序的结果.这两种方法的参数都差不多,都有key和reverse两个参数,sorted()多了一个排序对阅读全文

posted @ 2020-04-30 17:34 MSTK 阅读(11599) 评论(0) 推荐(0)

2020年3月31日

MASK-RCNN(2)

摘要： 2. Network Architecture 网络分为两个部分:第一部分是backbone卷积网络,用于提取整张图的特征;第二部分是head,用于对ROI进行处理,分为两个分支,一个分支用来对box分类和回归,另一部分进行mask预测。网络的Backbone采用ResNet或者FPN(Featu 阅读全文

posted @ 2020-03-31 20:23 MSTK 阅读(316) 评论(0) 推荐(0)

2020年2月24日

IoU-aware Single-stage Object Detector for Accurate Localization

摘要：网络的结构如下：采用FPN结构,Backbone是RetinalNet,分成了P3~P7共5个Layer,分别训练不同尺寸的Box.每个Layer对应的Head有2个分支,包括一个单独的分支用来预测分类,另一个分支用来预测两部分,一部分是Box坐标的回归,另一部分是GT Box和Anchor之间的阅读全文

posted @ 2020-02-24 16:11 MSTK 阅读(959) 评论(0) 推荐(0)

2020年1月31日

自定义Keras Layer

摘要： Keras定义Layer的方法. 阅读全文

posted @ 2020-01-31 18:05 MSTK 阅读(369) 评论(0) 推荐(0)

2019年12月31日

Keras的TimeDistributed层

摘要： Keras的TimeDistributed层主要用途是在时间维度上进行全连接. 比如Faster RCNN,1张图生成了16个ROI,需要对每一个ROI进行分类和回归,ROI的维度是7×7×512,长度和宽度都是7,512个通道,16个ROI的的维度是16×7×7×512,需要得到16个分类和回归, 阅读全文

posted @ 2019-12-31 21:04 MSTK 阅读(2135) 评论(0) 推荐(1)

2019年11月30日

MASK-RCNN(1)

摘要： MASK-RCNN是一个多用途的网络,可以用来做目标检测,实例分割或者人体姿态识别.主要结构如下. 简单的说,就是首先用Faster-RCNN获得ROI,再进行ROI Align,然后输出ROI的分类,同时输出分割掩码. 1. Faster-RCNN和ROI Align Faster-RCNN是一个阅读全文

posted @ 2019-11-30 21:53 MSTK 阅读(445) 评论(0) 推荐(0)

2019年10月30日

FCOS及其和Faster R-CNN的区别

摘要： RetinaNet，SSD，YOLOv3，Faster R-CNN等都是Anchor-based的检测器，即需要预定义的Anchor boxes来进行训练。FCOS是一种Anchor-free和Proposal-free的检测器，即不需要预定义Anchor boxes来进行训练，从而节省了对计算资源阅读全文

posted @ 2019-10-30 23:15 MSTK 阅读(1294) 评论(0) 推荐(0)

代码空间

Computer Vision/Machine Learning/Evolutionary Computation...

公告