摘要:
目的:为了让训练效果更好 bagging:是一种并行的算法,训练多个分类器,取最终结果的平均值 f(x) = 1/M∑fm(x) boosting: 是一种串行的算法,根据前一次的结果,进行加权来提高训练效果 stacking; 是一种堆叠算法,第一步使用多个算法求出结果,再将结果作为特征输入到下一 阅读全文
posted @ 2019-01-17 13:16
python我的最爱
阅读(4124)
评论(0)
推荐(0)
摘要:
根据每一个特征分类后的gini系数之和除于总特征的gini系数来计算特征重要性 阅读全文
posted @ 2019-01-17 10:31
python我的最爱
阅读(10376)
评论(0)
推荐(0)
摘要:
1.GridSeach(RandomRegressor(), param_grid, cv=3) GridSearch第一个参数是算法本身, 第二个参数是传入的参数组合, cv表示的是交叉验证的次数 GridSearch 对给定的参数进行两两的组合搜索,比如参数为[1, 2, 3], [1, 2, 阅读全文
posted @ 2019-01-17 10:23
python我的最爱
阅读(1271)
评论(0)
推荐(0)
摘要:
from sklearn import tree from sklearn.cross_validation import train_test_split # 数据拆分 train_x, test_x, train_y, test_y = train_test_split(housing.data, housing.target, test_size=0.1, random_state=42... 阅读全文
posted @ 2019-01-17 09:48
python我的最爱
阅读(509)
评论(0)
推荐(0)
摘要:
from sklearn import tree from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() dtr = tree.Deci 阅读全文
posted @ 2019-01-17 09:35
python我的最爱
阅读(2029)
评论(0)
推荐(0)
浙公网安备 33010602011771号