语义分割之BiSeNet

作业内容

1:文字回答:辨析TP、FN、FP、TN分别对应的含义(参考第一课时PPT14页中的图)

TP:   真实为1,预测为1

FP:真实为0,预测为0

FN:真实为1,预测为0

TN:真实为0,预测为0

2:代码实现:根据需要自行搜索第一课时所提及损失函数的代码定义

交叉熵

加权交叉熵

Focal loss

Dice系数

Jaccard系数

Tversky系数

Lovasz-Softmax loss

3:文字回答:为什么分类器不能只用准确率这一个指标进行评判


不看精确率,召回率无法得到模型的全部性能

4:文字回答:简述实时语义分割模型的加速方法

1)通过裁剪或resize来限定输入的图片大小,以降低计算复杂度。尽管这种方法简单有效,但空间细节的损失,尤其是边界部分,会导致算法精度下降

2)通过减少网络通道数量加快处理速度,尤其是在骨干模型的早期阶段,但会弱化空间信息

3)为追求极其紧凑的框架而丢掉模型最后阶段(比如ENet),该方法的缺点也很明显,由于ENet抛弃了最后阶段的下采样,模型的感受野不足以涵盖大物体,导致判别能力较差。

4)为弥补空间细节的丢失,很多人采用U型结构,但U型结构在高分辨率特征图上引入额外的计算,会降低模型速度;丢失掉的空间信息无法通过引入浅层修复,因此性价比不高。

5:代码实现:用BiSeNet实现对CityScapes数据集的分割

posted @ 2020-10-26 15:30  sariel_sakura  阅读(487)  评论(0编辑  收藏  举报