无监督通用异常检测方法SEAD解析
在当今的工业和在线应用中,实时数据流中的异常检测至关重要。异常可能预示着制造缺陷、系统故障、安全漏洞或其他重要事件。传统的基于机器学习的异常检测系统需要监督训练,但在在线场景中,数据多样且分布不断变化,使得数据收集和标注成本高昂。
为解决这些问题,某研究团队提出了一种名为SEAD(流式异常检测集成)的方法。SEAD采用无监督方式运行,无需标注异常数据,并能动态适应数据变化。该方法通过集成多个异常检测模型,始终为每种数据类型选择最佳模型。
SEAD的核心思想是异常具有稀有性。系统会为持续产生较低异常分数的基检测器分配更高权重。由于不同基检测器使用不同的评分系统,SEAD通过将分数分配到不同分位数进行归一化处理。权重更新采用乘法权重更新机制(MWU),该机制会降低持续输出高分数的检测器权重。
在评估中,SEAD在15个任务上的平均排名最高(5.07),方差最低(6.64)。即使向集成中添加随机生成分数的算法,SEAD的准确率仅下降0.88%。针对计算效率问题,团队还开发了SEAD++变体,通过概率采样实现约两倍的加速,同时保持较高准确率。
SEAD代表了流数据异常检测领域的重大进展,其实时选择最佳模型的能力使其成为各种应用的宝贵工具,为流环境中的异常检测设立了新标准。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码


浙公网安备 33010602011771号