Pascal voc api - roidb结构

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_34809033/article/details/83215698
         <!--一个博主专栏付费入口结束-->
        <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
                                    <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css">
            <div class="htmledit_views" id="content_views">
                                        <p>roidb是由字典组成的list,每张图片对应一个字典,roidb[img_index]包含了该图片索引所包含的roi信息,下面以roidb[img_index]为例说明:</p>

box_num:一幅图片中所包含的box数量

class_num:分类所包含的种类数量

roidb[img_index]包含的key value
boxes box位置信息,box_num*4的np.array
gt_overlaps 所有box在不同类别的得分,box_num*class_num的矩阵
gt_classes 所有box的真实类别,box_num长度的list
flipped 是否翻转
image 该图片的路径,字符串
width 图片的宽
height 图片的高
max_overlaps 每个box在所有类别的得分最大值,即gt_overlaps行最大值,box_num长度
max_classes 每个box的得分最高所对应的类,box_num长度
bbox_targets 每个box的类别,以及与最接近的gt-box的4个方位偏移

参考:

  1. roidb.py
posted @ 2019-11-19 19:59  Le1B_o  阅读(198)  评论(0编辑  收藏  举报