2019年3月12日

kaggle教程--10--数据泄露

摘要: 数据泄露(Data leakage) 常见的数据泄露有2种:Leaky Predictors和Leaky Validation Strategies Leaky Predictors:任何在目标属性出现后,会随之更新或出现的特征属性,都应该排除在训练集之外 避免方法: 1 筛选可能造成数据泄露的特征 阅读全文

posted @ 2019-03-12 15:03 wangzhonghan 阅读(479) 评论(0) 推荐(0)

kaggle教程--9--交叉验证

摘要: 交叉验证(Cross Validation) Cross-Validation and Train-Test Split 数据很多的时候,用Train-Test Split,时间短 数据不多的时候,用Cross-Validation,模型的分数准 例子1: import pandas as pdda 阅读全文

posted @ 2019-03-12 10:47 wangzhonghan 阅读(316) 评论(0) 推荐(0)

导航