缺失值处理

缺失值处理

查看存在的缺失值
dataframe.isnull().sum()

1、直接删除该特征
dataframe.drop(['删除的列'], axis=1)

2、删除有缺失值的样本
dataframe.dropna()

3、将缺失值作为新的特征

4、使用均值或中值填充缺失值

// 均值填充
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values = 'NaN', strategy='mean', axis=0)
df = imp.fit_transform(df)

// 中值填充
imp = Imputer(missing_values = 'NaN', strategy='median', axis=0)
df = imp.fit_transform(df)

// 指定数值填充
imp = Imputer(missing_values = 'NaN', strategy='cosntant', fill_value=0)
df = imp.fit_transform(df)

5、参考其他特征,利用与此特征相关的算法填充缺失值

posted @ 2021-04-27 23:52  ysj101  阅读(77)  评论(0)    收藏  举报