《利用python进行数据分析》之《第二章引言》学习笔记_2

pandas缺失值补充

1、创建带有缺失值的数据框

#coding:utf8

import pandas as pd

import numpy as np

df=pd.DataFrame(np.random.randn(5,3),index=list('abcde'),columns=['one','two','tree'])

df.1x[1,:-1]=np.nan

df.1x[1:-1,2]=np.nan

print '\ndf1'

print df

2、使用0替换缺失值

print '\zero'

print df.fillna(0)

3、使用字符串替换缺失值

print '\nmissing'

print df.fillna('missing')

4、用上一个数据来替代

print '\npad'

print df.fillna(method='pad')

5、用后一个数据来替代,用limit限制每一列可以替换的数量

print '\nbfill'

print df.fillna(method='bfill',limit=1)

6、用平均数来替换

print '\nmean'

print df.fillna(df.mean())

6、选择某列用平均数来替换

print '\nlimit mean'

print df.fillna(df.mean() ['one':'two'])

posted @ 2017-09-12 16:52  CodingNoStop  阅读(101)  评论(0)    收藏  举报