摘要:LDA 主题模型( Latent Dirichent Allocation) 隐含迪利克雷分布 机器学习的创痛模型中还有一个LDA :就是Linear decision Analise线性判别模型 LDA是机器学习领域的一个传统模型,可以学习的东西非常的多,很经典。同时,他也是nlp领域必学打的一个
阅读全文
摘要:无监督学习——聚类 Kmeans聚类 背景: 在机器学习的训练中,不是所有情况下训练数据都是由标注的,有时候数据存在无法标注或者标注代价高的情况。 这就需要我们在数据没有分类的情况下找到训练数据的方法。 思想:当我们拿到一堆没有被标注的训练数据x,假设这对数据自然存在k类。那我么认为这k类数据在空间
阅读全文
摘要:最近在网上点击了不好啊岗位查看岗位需求,不少的岗位都提到了GBDT,既然如此,分三步整理出GBDT的主线思路。 1.复习一下课程 2.网上查阅一下资料 3.手写一下笔记 Grandint Boosting Decision Tree(梯度提升决策树) 残差学习,运用到的数学技巧很多,传统模型也就是这
阅读全文
摘要:集成学习 集成学习主要有两种思想: 集成弱学习器,提升分类能力 集成强学习器,提升泛化能力 Random Forest 随机森林 强分类器的方差(泛化能力)提升 思想:若干个独立训练的分类器,并行训练,每个分类器对应于一个f1输出,得到(f1,f2,。。。,fn),求和取平均得到新的F。 选用什么分
阅读全文
摘要:SVM支持向量机--曾经的王者(硬间隔、软间隔、核函数、拉格朗日凸优化) 思路(SVM) 对于简单的情况,二位线性可分平面的分类,训练标注数据为[x, y]。为了提高模型的鲁棒性,和抗噪声能力。理论上存在一条宽度为D = 2d的隔离带。 两类数据分别再这条隔离带的两边。隔离带的确定,仅仅有支持向量所
阅读全文
摘要:前言: 从去年的一月份报名马士兵教育人工智能系列课程已经4个月过去。学习过程中记了不少笔记,一直琢磨着待觉得差不多的时候将笔记稍作整理,建个博客。以费曼学习之法,加深记忆。刚好最近学习到了因子分解机器。顿挫之后决定以此作为第一篇博文论题之选。 14年毕业之后未再提笔学习,学习起步的过程非常的痛苦,今
阅读全文