摘要: 原文链接:https://blog.csdn.net/m_buddy/article/details/79337492 前言本文中针对XGBoost的参数说明进行部分翻译得来,原文链接。因而本文中只对一些关键参数进行了翻译,且由于本人能力有限,文中难免存在错误的地方,还望指正。以下是大致翻译内容。在 阅读全文
posted @ 2020-02-07 21:27 veg_birds 阅读(2443) 评论(0) 推荐(0)
摘要: 原文链接:https://blog.csdn.net/u014033218/article/details/88382259 1. GBDT + LR 是什么本质上GBDT+LR是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文 阅读全文
posted @ 2020-01-14 11:16 veg_birds 阅读(1355) 评论(0) 推荐(0)
摘要: 声明:版权所有,转载请联系作者并注明出处 http://blog.csdn.net/u013719780?viewmode=contents 0x00 前言 数据预处理包含数据探索、数据清洗和特征预处理三部分,《特征工程系列:特征预处理(上)》介绍了无量纲化和特征分桶相关的处理方法,本章将继续介绍特 阅读全文
posted @ 2020-01-13 18:09 veg_birds 阅读(5787) 评论(0) 推荐(0)
摘要: 1.公式: log1p = log(x+1) 【当x很小时,log(x)会出错。】 exmp1 = exp(x) -1 【当x很大时,会报错overflow】 两者互为反函数 2.使用场景: 如果数据非正态,有左偏情况,可以使用log1p进行平滑 可以看出,使用log1p后,数据明显正态化。 同理, 阅读全文
posted @ 2020-01-03 15:35 veg_birds 阅读(1806) 评论(0) 推荐(1)