1.数据处理
1.删除常值列
constant_columns = df.columns[df.nunique() == 1]
print("常数列: ", constant_columns)
df = df.drop(columns=constant_columns)
print(len(df.columns))
2.删除缺失值较大的列(或进行填充)
missing_percent = df.isnull().mean() # 计算每一列的缺失值占比
columns_to_drop =missing_percent[missing_percent > 0.5].index
print(columns_to_drop)
print(len(columns_to_drop))
df = df.drop(columns=columns_to_drop)

浙公网安备 33010602011771号