2025 年 8月 11 日随笔档案 - 起名字太难0123

2025年8月11日

摘要：一、数据清洗缺失值：填充或删除缺失率过高的特征（缺失率不高的列，可尝试填充）填充方法：knn、众数、中位数... 常值列：删除常值特征列异常值：用箱线图（IQR 法则）、Z-score 或可视化（如散点图）识别异常值进行完列数据清洗后，用pandas.drop_duplicates()删除完阅读全文

posted @ 2025-08-11 00:02 起名字太难0123 阅读(46) 评论(0) 推荐(0)

dz1314

公告