数据预处理1之缺失值处理
import numpy as np
import pandas as pd
data1 = pd.read_csv("F:/tianic_train.csv")
#查看非缺失值个数
data1.notnull().sum()
#查看缺失值个数
data1.isnull().sum()
#删除缺失值
data1.dropna(axis=0
,thresh=1 #最少的非缺失值个数
,how="any" #any:有一个就删除,all:所有为缺失值,则删除
,inplace=False
)
#填补缺失值
data1.fillna(value=0 #填充值
,axis=0
# ,method="ffill" #填充方法,fill:跟前填充,bfill:跟后填充
# ,limit=1 #填充限制个数,只可以与method搭配使用才有效
,inplace=False
)
#使用字典,为不同的列填补不同的值
data1.fillna(value={"Age":0,"Embarked":"S"}
)
1.本篇所有数据文件小博已上传,需要的小伙伴到“文件”进行下载使用。数据文件纯属学习教学所用,纯属虚构。
2.文章中的代码都是经过小博的真实操作,可以执行。(注:Anaconda3的Jupyter notebook)
浙公网安备 33010602011771号