摘要: 当数据预处理完成后,我们就要开始进行特征工程了。 #导入数据,让我们使用digit recognizor数据来一展身手 import pandas as pd data = pd.read_csv(r"C:\work\learnbetter\micro-class\week 3 Preprocess 阅读全文
posted @ 2021-06-24 23:58 秋华 阅读(787) 评论(0) 推荐(0)
摘要: 1 处理分类型特征:编码与哑变量 from sklearn.preprocessing import LabelEncoder y = data.iloc[:,-1] #要输入的是标签,不是特征矩阵,所以允许一维 le = LabelEncoder() #实例化 le = le.fit(y) #导入 阅读全文
posted @ 2021-06-24 23:12 秋华 阅读(405) 评论(0) 推荐(0)
摘要: 1 数据无量纲化 from sklearn.preprocessing import MinMaxScaler data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] #不太熟悉numpy的小伙伴,能够判断data的结构吗? #如果换成表是什么样子? import 阅读全文
posted @ 2021-06-24 22:53 秋华 阅读(522) 评论(0) 推荐(0)
摘要: 1 Bagging vs Boosting 2 RFC的参数列表 3 RFC的属性列表 4 RFC的接口列表 阅读全文
posted @ 2021-06-24 19:56 秋华 阅读(140) 评论(0) 推荐(0)