基于双因子神经网络图像分析的建筑和拆除废弃物分类方法
原理

图1. 使用双因子神经网络图像分析进行建筑和拆除废弃物分类的方法示意图
从论文的示意图可以看出,双因子神经网络中的双因子指代 YOLO11 和 ResNet50 Set,其中 YOLO11 用于识别出图片中的建筑垃圾并进行标注,ResNet50 则负责对识别出来的建筑垃圾进行分类。
与正常情况下直接采用 YOLO11 对目标物体进行多分类的做法不同,论文选用 ResNet50 进行分类,并且是采用了集成二分类分类器的方法进行分类,通过对比每个分类器的打分来决定最终分类,看起来与 Random Forest 思想有相似之处,如果想要进一步提升效果可以考虑选用更加复杂的集成学习方法。
在存在歧义 (分类器打分相同) 的情况下,则让 YOLO11 介入裁决,在YOLO和其中一个二元分类器估计值一致的情况下,该类被确定为占优,个人对这种处理方式持保留意见,论文后面验证部分提及 YOLO11 对于垃圾分类中的特定垃圾分类效果相当差,如此融合的效果是否会提升实在是难以判定。

图2. 用于二元分类的典型 ResNet50 模型训练方案
从图2就可以看出,为了训练二分类模型,每个分类器都将要识别的物体图片分为目标图像和其他,以此进行二元分类器训练,其中其他类别是通过将其他类型的建筑废物和建筑残渣以相等的比例组合而成的,使用10个神经网络分类器,每个类别一个。此外还对原数据进行增强操作,每个图片旋转 45° 四次,生成 4 个新样本,并且对每个新反转样本, 根据亮度和对比度参数应用随机颜色变化。从而形成一个扩展的子数据集。
论文中提供了三个数据集来源,可作为参考。
总结
该论文与上一篇相比质量明显偏低,所以仅供一点基础参考,不做详细分析阅读。

浙公网安备 33010602011771号