摘要:我们都知道,在调用sklearn中的随机森林时,是可以通过feature_importances_查看每个特征的重要程度的。 其主要通过置换检验来求得特征的重要程度。 如果特征k是重要的,那么用随机的值将该列特征破坏,重新训练和评估,计算模型的泛化能里的退化程度,即: inportance(k) = 阅读全文
posted @ 2019-08-01 11:36 张知行 阅读 (52) 评论 (0) 编辑
摘要:随机森林oob的理解 阅读全文
posted @ 2019-07-08 11:58 张知行 阅读 (181) 评论 (0) 编辑
摘要:pandas中groupby的参数:as_index的见解 阅读全文
posted @ 2019-06-23 21:17 张知行 阅读 (424) 评论 (0) 编辑
摘要:机器学习实战笔记——使用 k-近邻算法改进约会网站的配对效果 阅读全文
posted @ 2019-06-20 15:27 张知行 阅读 (29) 评论 (0) 编辑
摘要:机器学习实战中的KNN基本代码 阅读全文
posted @ 2019-06-18 20:50 张知行 阅读 (33) 评论 (0) 编辑