缺失值处理
缺失值处理
查看存在的缺失值
dataframe.isnull().sum()
1、直接删除该特征
dataframe.drop(['删除的列'], axis=1)
2、删除有缺失值的样本
dataframe.dropna()
3、将缺失值作为新的特征
4、使用均值或中值填充缺失值
// 均值填充
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values = 'NaN', strategy='mean', axis=0)
df = imp.fit_transform(df)
// 中值填充
imp = Imputer(missing_values = 'NaN', strategy='median', axis=0)
df = imp.fit_transform(df)
// 指定数值填充
imp = Imputer(missing_values = 'NaN', strategy='cosntant', fill_value=0)
df = imp.fit_transform(df)
5、参考其他特征,利用与此特征相关的算法填充缺失值

浙公网安备 33010602011771号