9.1_异常值检测

异常值检测(anomaly detection)

  1. 最常用的是欺诈检测 fraud detection
  2. 如何求到ε?

高斯分布(正态分布)

1.钟型的面积是1
2.参数估计
3.方差的含义:(样本减去平均值)的平方 再求平均


高斯分布实现异常值检测

1.选择出特征量,你认为是可以检测出异常值的
2.求出每一个参数的方差和。
3.求积得到P
4.把检测值放入P中,与ε比较


如何选择特征变量(满足高斯模式)

1.log,平方,开方 使得数据呈现高斯状态
2.误差分析: 当遇到异常值和正常值计算出的P都很大的时候,采取增加新的特征,eg数据中心


多元高斯分布(multivariate)

1.原因:检测不出来
2.如何:不将p1,p2分开

posted @ 2016-06-01 19:59  nice_day  阅读(335)  评论(0)    收藏  举报