03 2023 档案

摘要:先说结论:应该先“划分数据集”,再进行“特征选择”。这样可以避免数据泄露。 测试集就应该当做“看不见的数据”,只能在最后用一次,按照这个原则处理。 代码实例: # -*- coding: utf-8 -*- import numpy as np from sklearn.feature_select 阅读全文
posted @ 2023-03-28 23:01 温小皮 阅读(385) 评论(0) 推荐(0) 编辑