摘要:
去极值的方法,可以用均值加n倍的方差,来过滤,也可以用中位数加上下范围来过滤。如聚宽就提供了winsorize和winsorize_med等方法。 但我总觉得不合心意,第一,这个过程本来就是需要不断调整参数的,最好能够按照一定步长来取数据,逐条显示取出数据的数量,占比,方差等。此外,参数最好指定数据的百分比,用户只要指定百分比,就能够获得相应的数据。基于此,设计了一个函数。from pandas ... 阅读全文
posted @ 2019-08-27 19:55
jetz
阅读(2660)
评论(0)
推荐(0)
浙公网安备 33010602011771号