吴恩达-异常分析
1.核心概念利用正态分布求解每一个feature的密度概率
正态分布(高斯分布):

对于每一个样本x:

设定一个threshold,其中对于样本x如果p(x)<threshold,则为异常
当正样本特别少负样本特别多(20正,10000负),此时如果用supervised learning,负样本占主导,对正样本预测时可能会导致较大误差,此时用异常分析
如果正样本和负样本都很多,supervised learning更合适
1.核心概念利用正态分布求解每一个feature的密度概率
正态分布(高斯分布):

对于每一个样本x:

设定一个threshold,其中对于样本x如果p(x)<threshold,则为异常
当正样本特别少负样本特别多(20正,10000负),此时如果用supervised learning,负样本占主导,对正样本预测时可能会导致较大误差,此时用异常分析
如果正样本和负样本都很多,supervised learning更合适