2017年2月17日
摘要: XGBOOST的威力不用赘述,反正我是离不开它了。 具体XGBOOST的原理可以参见之前的文章《比XGBOOST更快--LightGBM介绍》 今天说下如何调参。 bias-variance trade-off xgboost一共有几十个参数: http://xgboost.readthedocs. 阅读全文
posted @ 2017-02-17 10:43 一白侃数 阅读(825) 评论(0) 推荐(0) 编辑
摘要: xgboost的出现,让数据民工们告别了传统的机器学习算法们:RF、GBM、SVM、LASSO........。现在,微软推出了一个新的boosting框架,想要挑战xgboost的江湖地位。笔者尝试了一下,下面请看来自第一线的报告。 包含以下几个部分: 一. 基本介绍 二. XGBOOST原理及缺 阅读全文
posted @ 2017-02-17 10:42 一白侃数 阅读(1182) 评论(0) 推荐(1) 编辑
摘要: hive之于数据民工,就如同锄头之于农民伯伯。hive用的好,才能从地里(数据库)里挖出更多的数据来。 用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。 hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、spark-sql等 阅读全文
posted @ 2017-02-17 10:41 一白侃数 阅读(28032) 评论(0) 推荐(1) 编辑