数据预处理1之缺失值处理

import numpy as np
import pandas as pd

  

data1 = pd.read_csv("F:/tianic_train.csv")

  

#查看非缺失值个数

data1.notnull().sum()
  

  

#查看缺失值个数

data1.isnull().sum()

  

#删除缺失值

data1.dropna(axis=0
             ,thresh=1  #最少的非缺失值个数
             ,how="any" #any:有一个就删除,all:所有为缺失值,则删除
             ,inplace=False
            )

  

#填补缺失值

data1.fillna(value=0 #填充值
             ,axis=0
            # ,method="ffill"  #填充方法,fill:跟前填充,bfill:跟后填充
            # ,limit=1  #填充限制个数,只可以与method搭配使用才有效
             ,inplace=False
            )

  

#使用字典,为不同的列填补不同的值

data1.fillna(value={"Age":0,"Embarked":"S"} 
            )

  

posted @ 2020-01-15 19:16  数据骆驼  阅读(270)  评论(0)    收藏  举报