Pandas 常用方法集

fillna()会填充nan数据,返回填充后的结果。如果希望在原DataFrame中修改,则把inplace设置为True

df =pd.DataFrame({
    'data1':[1,2,np.nan,3,np.nan,4,5],
    'data2':[34,67,np.nan,np.nan,52,77,np.nan]
})
df.fillna(888,inplace=True)  # inplace为True 代表替换原数据
df

 

# 去除特定列下面的重复行
df.drop_duplicates(subset=None, keep='first', inplace=False)
    # subset 指定 列名
    # keep 'first' 删除重复项并保留第一次出现的项
    # keep 'last'  最后一次出现的项

 

pandas的分段函数cut()

# 更改行名,或列名
df = pd.DataFrame({'A':[1,2]
                   ,'B':[3,4]})
df.rename(columns={'B':'K'},inplace=True)
df

 

posted @ 2020-05-10 15:11  籽俊  阅读(147)  评论(0编辑  收藏  举报