import pandas as pd
import numpy as np
data = pd.read_csv("./data/test.csv")
print(data)
print(pd.isnull(data)) # 缺失值True,其他False
print(np.any(pd.isnull(data))) # 有缺失值True,没有False
print(np.all(pd.notnull(data))) # 没有缺失True,有False
print(pd.isnull(data).any()) # 每列是否有缺失
print(pd.notnull(data).all()) # 每列没有缺失
print(data.dropna()) # 删除所有的缺失值
print(data.fillna("NULL")) # 替换NULL
# 替换
data_new = data.replace("?",value=np.nan)
print(data_new.dropna())
a b c d
0 1 2 3.0 4.0
1 1 2 NaN 4.0
2 1 ? 3.0 4.0
3 1 2 3.0 4.0
4 1 2 3.0 NaN
a b c d
0 False False False False
1 False False True False
2 False False False False
3 False False False False
4 False False False True
True
False
a False
b False
c True
d True
dtype: bool
a True
b True
c False
d False
dtype: bool
a b c d
0 1 2 3.0 4.0
2 1 ? 3.0 4.0
3 1 2 3.0 4.0
a b c d
0 1 2 3 4
1 1 2 NULL 4
2 1 ? 3 4
3 1 2 3 4
4 1 2 3 NULL
a b c d
0 1 2 3.0 4.0
3 1 2 3.0 4.0