摘要:
ML很重要的一点是避免数据泄露的风险: 1、数据预处理造成数据泄露 在数据标准化(如StandardScaler)的时候,如果直接对所有数据(训练集+验证集/测试集)统一计算均值/方差并标准化,训练过程会隐式利用测试集分布信息,导致模型评估结果被高估,失去真实性。 通用防泄露原则: 🔒 黄金法 阅读全文
posted @ 2025-07-17 17:48
计算之道
阅读(15)
评论(0)
推荐(0)
摘要:
ML很重要的一点是避免数据泄露的风险: 1、数据预处理造成数据泄露 在数据标准化(如StandardScaler)的时候,如果直接对所有数据(训练集+验证集/测试集)统一计算均值/方差并标准化,训练过程会隐式利用测试集分布信息,导致模型评估结果被高估,失去真实性。 通用防泄露原则: 🔒 黄金法 阅读全文
posted @ 2025-07-17 17:48
计算之道
阅读(15)
评论(0)
推荐(0)
|