自动化视觉检测系统的实用化突破
使自动化视觉检测系统实用化
包含产品无关公共数据集、模型选择指南和评估方法的基准框架,有助于弥合研究与实际应用之间的差距。
视觉产品检测的重要性
视觉产品检测在制造业、零售业和许多其他行业中至关重要。发运损坏物品会侵蚀客户信任,并产生退款或更换的额外成本。如今,自动化检测过程以提高吞吐量、降低成本和加速反馈循环的兴趣日益增长。
异常检测是预测产品是否偏离常态,表明可能存在缺陷;异常定位是更复杂的任务,需使用像素级异常分数来突出异常区域。尽管计算机视觉取得了进展,但研究与异常定位方法在实际生产环境中的应用之间仍存在差距。大多数现有模型专注于产品特定缺陷,因此对处理不同产品的制造商用途有限。
基准框架的创新
在某机构最近发表于《制造系统杂志》的论文中,提出了首个针对实际异常定位的基准框架——新标记的产品无关数据集和建议的评估协议。通过重新标记现有数据集中的异常样本,捕获更高级的人类可理解描述,生成了可用于以通用、产品无关方式评估模型的新数据集。
同时确定了最优建模方法,开发了高效的训练和推理方案,并对各种技术进行了消融研究,以估计用于分割图像异常和非异常区域的最佳像素强度阈值。来自不同行业的用户可以使用此基准框架在生产流水线中部署自动化视觉检测。
无监督学习优势
使用监督学习训练异常定位模型存在主要缺点:与无缺陷产品图像相比,有缺陷产品图像稀少;且标记有缺陷产品图像成本高昂。因此,基准框架在训练阶段不需要任何异常图像。相反,模型从无缺陷示例中学习典型图像特征的分布。
然后在验证阶段,仅需少量异常图像即可确定正常和异常像素之间的边界应落在异常分数分布的何处。在推理时,训练后的模型生成异常分数图以突出每个输入图像中的异常。随后使用最佳像素强度阈值计算分割图,屏蔽非异常像素。
框架三大核心组件
基准框架包含三个主要构建块:产品无关数据集、模型集合和评估方法集合。根据生成异常分数图的方式,将建模方法分为四大类:重建、归因图、块相似性和标准化流。框架包含每个类别的最先进代表。
双重评估流程
对于实际使用,异常定位应遵循双重评估程序:验证指标不需要阈值,但推理指标需要。强调阈值值的有效确定,解决了先前研究中的空白。不同指标在不同实际用例中具有优势:基准提供推理(阈值依赖)指标的详细分析,比较四种建模方法和五种不同阈值估计技术。
产品无关数据集的构建
为创建产品无关数据集,根据更高级、更通用的类别重新分类两个现有数据集(MVTec和BTAD)中的异常图像。两个数据集中的异常图像包括像素精确的异常分割图,突出缺陷并屏蔽无缺陷区域。
首先根据是否存在背景对产品图像进行分类。有背景的图像以背景为衬托展示产品(如瓶子或榛子)。无背景的图像中,产品的特写(如地毯编织或木材纹理)占据图像所有像素。
四类缺陷标注
进一步根据四种产品无关缺陷类别标记异常产品图像:
- 结构缺陷:扭曲或缺失的物体部件或产品结构的重大损坏。例如:孔洞、弯曲、缺失部件等。
- 表面缺陷:主要限于产品表面较小区域的缺陷,需要相对较少的修复。例如:划痕、凹痕、铁锈等。
- 污染缺陷:表明存在某些外来材料的缺陷。例如:胶水滑移、灰尘、污垢等。
- 复合缺陷:结合上述任何三种类型的缺陷,在真实分割图中具有多个连接组件。例如:污染背景中的孔洞。
标注由注释员团队使用定制用户界面完成。注释员通过将每个异常图像与无缺陷产品图像进行比较,参考相应的真实分割图进行适当的缺陷分类。这些产品无关标签现可在论文补充材料中获取。研究人员可使用这些标签进行新实验并开发产品无关基准。
新产品基准测试实践
基准框架为建模方法选择、阈值估计方法和评估过程提供了宝贵见解和指导。作为制造商引入新产品的高效起点,建议使用基于块相似性的块分布模型(PaDiM),并从IoU(交并比)曲线估计阈值。如果表面缺陷更可能出现,基于标准化流的条件标准化流(CFLOW)模型可能比PaDiM更可取。在强调验证指标局限性的同时,强调IoU是用于估计分割性能的更可靠推理指标。
具体应用示例
以MVTec数据集中的瓶子产品为例说明过程。数据集包含209张正常和63张异常瓶子图像。第一步是根据产品无关分类标注异常图像;这产生41张具有结构缺陷的图像,21张具有污染缺陷的图像,和1张具有复合缺陷的图像。给定此缺陷比例,PaDiM应为适当的建模方法,最佳阈值从IoU曲线确定。后续步骤包括在正常图像上训练PaDiM,使用验证集估计阈值,为测试集图像生成分割图,并视觉确认缺陷区域以进行领域理解。
发布此基准希望其他研究人员能在此基础上扩展,帮助弥合异常定位在研究中的显著进展与实际应用挑战之间的差距。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码


浙公网安备 33010602011771号