9.1_异常值检测
异常值检测(anomaly detection)
- 最常用的是欺诈检测 fraud detection
- 如何求到ε?
高斯分布(正态分布)
1.钟型的面积是1
2.参数估计
3.方差的含义:(样本减去平均值)的平方 再求平均


高斯分布实现异常值检测
1.选择出特征量,你认为是可以检测出异常值的
2.求出每一个参数的方差和。
3.求积得到P
4.把检测值放入P中,与ε比较



如何选择特征变量(满足高斯模式)
1.log,平方,开方 使得数据呈现高斯状态
2.误差分析: 当遇到异常值和正常值计算出的P都很大的时候,采取增加新的特征,eg数据中心


多元高斯分布(multivariate)
1.原因:检测不出来
2.如何:不将p1,p2分开




浙公网安备 33010602011771号