2025年7月15日

异常检测:K-Means算法

摘要: K-Means算法是一个聚类算法,在样本没有类别的情况下可以通过算法聚出类别,比如某公司中有大量的用户,现在需要我们将用户划分出类别,但是现在我们并不知道怎么划分更好,这个时候就可以通过K-Means算法来帮助我们划分出类别。其原理是通过计算样本到质心的距离来对样本聚出类别,其中的距离我们可以理解为 阅读全文

posted @ 2025-07-15 20:59 limingqi 阅读(98) 评论(0) 推荐(0)

异常检测:3西格玛原则

摘要: 3σ原则基于正态分布的数学原理,它假设一组检测数据中只含有随机误差,通过计算得到标准偏差σ,然后按一定概率确定一个区间,对于超过这个区间的误差,就不属于随机误差而是粗大误差,将含有粗大误差的数据进行剔除。 在统计学中,如果一个变量服从正态分布,且它的均值是u, 标准差是σ,那么将有: (1)68.2 阅读全文

posted @ 2025-07-15 20:49 limingqi 阅读(654) 评论(0) 推荐(0)

导航