语义分割之BiSeNet

作业内容：

1：文字回答：辨析TP、FN、FP、TN分别对应的含义（参考第一课时PPT14页中的图）

TP: 真实为1，预测为1

FP：真实为0，预测为0

FN：真实为1，预测为0

TN：真实为0，预测为0

2：代码实现：根据需要自行搜索第一课时所提及损失函数的代码定义

交叉熵

加权交叉熵

Focal loss

Dice系数

Jaccard系数

Tversky系数

Lovasz-Softmax loss

3：文字回答：为什么分类器不能只用准确率这一个指标进行评判

不看精确率，召回率无法得到模型的全部性能

4：文字回答：简述实时语义分割模型的加速方法

1）通过裁剪或resize来限定输入的图片大小，以降低计算复杂度。尽管这种方法简单有效，但空间细节的损失，尤其是边界部分，会导致算法精度下降

2）通过减少网络通道数量加快处理速度，尤其是在骨干模型的早期阶段，但会弱化空间信息

3）为追求极其紧凑的框架而丢掉模型最后阶段（比如ENet),该方法的缺点也很明显，由于ENet抛弃了最后阶段的下采样，模型的感受野不足以涵盖大物体，导致判别能力较差。

4）为弥补空间细节的丢失，很多人采用U型结构，但U型结构在高分辨率特征图上引入额外的计算，会降低模型速度；丢失掉的空间信息无法通过引入浅层修复，因此性价比不高。

5：代码实现：用BiSeNet实现对CityScapes数据集的分割

posted @ 2020-10-26 15:30 sariel_sakura 阅读(514) 评论(0) 收藏举报

刷新页面返回顶部

sariel_sakura