摘要: 在XGBoost算法原理小结中,我们讨论了XGBoost的算法原理,这一片我们讨论如何使用XGBoost的Python类库,以及一些重要参数的意义和调参思路。 本文主要参考了XGBoost的Python文档 和 XGBoost的参数文档。 1. XGBoost类库概述 XGBoost除了支持Pyth 阅读全文
posted @ 2019-07-01 18:10 刘建平Pinard 阅读(65184) 评论(135) 推荐(21) 编辑
摘要: 在两年半之前作过梯度提升树(GBDT)原理小结,但是对GBDT的算法库XGBoost没有单独拿出来分析。虽然XGBoost是GBDT的一种高效实现,但是里面也加入了很多独有的思路和方法,值得单独讲一讲。因此讨论的时候,我会重点分析和GBDT不同的地方。 本文主要参考了XGBoost的论文和陈天奇的P 阅读全文
posted @ 2019-06-05 20:36 刘建平Pinard 阅读(76508) 评论(201) 推荐(36) 编辑
摘要: 在矩阵向量求导前4篇文章中,我们主要讨论了标量对向量矩阵的求导,以及向量对向量的求导。本文我们就讨论下之前没有涉及到的矩阵对矩阵的求导,还有矩阵对向量,向量对矩阵求导这几种形式的求导方法。 本文所有求导布局以分母布局为准,为了适配矩阵对矩阵的求导,本文向量对向量的求导也以分母布局为准,这和前面的文章 阅读全文
posted @ 2019-05-27 17:19 刘建平Pinard 阅读(42046) 评论(27) 推荐(7) 编辑
摘要: 在机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法中,我们讨论了使用微分法来求解矩阵向量求导的方法。但是很多时候,求导的自变量和因变量直接有复杂的多层链式求导的关系,此时微分法使用起来也有些麻烦。需要一些简洁的方法。 本文我们讨论矩阵向量求导链式法则,使用该法则很多时候可以帮我们快速求出导数结果 阅读全文
posted @ 2019-05-07 15:59 刘建平Pinard 阅读(55414) 评论(70) 推荐(28) 编辑
摘要: 在机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法中,我们讨论了定义法求解矩阵向量求导的方法,但是这个方法对于比较复杂的求导式子,中间运算会很复杂,同时排列求导出的结果也很麻烦。因此我们需要其他的一些求导方法。本文我们讨论使用微分法来求解标量对向量的求导,以及标量对矩阵的求导。 本文的标量对向量 阅读全文
posted @ 2019-04-29 19:42 刘建平Pinard 阅读(40212) 评论(84) 推荐(18) 编辑
摘要: 在机器学习中的矩阵向量求导(一) 求导定义与求导布局中,我们讨论了向量矩阵求导的9种定义与求导布局的概念。今天我们就讨论下其中的标量对向量求导,标量对矩阵求导, 以及向量对向量求导这三种场景的基本求解思路。 对于本文中的标量对向量或矩阵求导这两种情况,如前文所说,以分母布局为默认布局。向量对向量求导 阅读全文
posted @ 2019-04-26 18:42 刘建平Pinard 阅读(41290) 评论(46) 推荐(19) 编辑
摘要: 在之前写的上百篇机器学习博客中,不时会使用矩阵向量求导的方法来简化公式推演,但是并没有系统性的进行过讲解,因此让很多朋友迷惑矩阵向量求导的具体过程为什么会是这样的。这里准备用几篇博文来讨论下机器学习中的矩阵向量求导,今天是第一篇。 本系列主要参考文献为维基百科的Matrix Caculas和张贤达的 阅读全文
posted @ 2019-04-22 18:03 刘建平Pinard 阅读(65743) 评论(19) 推荐(52) 编辑
摘要: 在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。 本篇主要参考了AlphaGo Zero的论文, AlphaGo Zero综述和AlphaG 阅读全文
posted @ 2019-03-27 20:11 刘建平Pinard 阅读(38009) 评论(69) 推荐(14) 编辑
摘要: 在强化学习(十七) 基于模型的强化学习与Dyna算法框架中,我们讨论基于模型的强化学习方法的基本思路,以及集合基于模型与不基于模型的强化学习框架Dyna。本文我们讨论另一种非常流行的集合基于模型与不基于模型的强化学习方法:基于模拟的搜索(Simulation Based Search)。 本篇主要参 阅读全文
posted @ 2019-03-04 17:09 刘建平Pinard 阅读(47940) 评论(29) 推荐(5) 编辑
摘要: 在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL),本篇我们讨论最后一种强化学习流派,基于模型的强化学习(Model Based RL),以及基于模型的强化学习算法框架Dyna。 本篇主要参考了UCL强化学习课程的第8讲和Dy 阅读全文
posted @ 2019-02-15 20:22 刘建平Pinard 阅读(24537) 评论(26) 推荐(2) 编辑