1.数据处理

1.删除常值列

constant_columns = df.columns[df.nunique() == 1]
print("常数列: ", constant_columns)
df = df.drop(columns=constant_columns)
print(len(df.columns))

2.删除缺失值较大的列(或进行填充)

missing_percent = df.isnull().mean() # 计算每一列的缺失值占比
columns_to_drop =missing_percent[missing_percent > 0.5].index
print(columns_to_drop)
print(len(columns_to_drop))
df = df.drop(columns=columns_to_drop)
posted @ 2025-12-08 15:26  起名字太难0123  阅读(6)  评论(0)    收藏  举报