06 2019 档案

【Python学习笔记】Pandas库之DataFrame
摘要:1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel 阅读全文

posted @ 2019-06-18 14:20 tan_2810 阅读(1177) 评论(0) 推荐(0)

python平台下实现xgboost算法及输出的解释
摘要:python平台下实现xgboost算法及输出的解释 1. 问题描述 ​ 近来, 在python环境下使用xgboost算法作若干的机器学习任务, 在这个过程中也使用了其内置的函数来可视化树的结果, 但对leaf value的值一知半解; 同时, 也遇到过使用xgboost 内置的predict 对 阅读全文

posted @ 2019-06-11 15:31 tan_2810 阅读(1475) 评论(0) 推荐(0)

XGBoost算法原理小结
摘要:在两年半之前作过梯度提升树(GBDT)原理小结,但是对GBDT的算法库XGBoost没有单独拿出来分析。虽然XGBoost是GBDT的一种高效实现,但是里面也加入了很多独有的思路和方法,值得单独讲一讲。因此讨论的时候,我会重点分析和GBDT不同的地方。 本文主要参考了XGBoost的论文和陈天奇的P 阅读全文

posted @ 2019-06-11 15:28 tan_2810 阅读(217) 评论(0) 推荐(0)

scikit-learn决策树算法类库使用小结
摘要:对决策树的算法原理做了总结,包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法,主要是讲解使用scikit-learn来跑决策树算法,结果的可视化以及一些参数调参的关键点。 1. scikit-learn决策树算法类库介绍 scikit-learn决策树算法类库内部实 阅读全文

posted @ 2019-06-11 15:26 tan_2810 阅读(269) 评论(0) 推荐(0)

导航