摘要: "EM算法及其应用(一)" EM算法及其应用(二): K means 与 高斯混合模型 上一篇阐述了EM算法的主要原理,这一篇来看其两大应用 —— K means 与 高斯混合模型,主要由EM算法的观点出发。 K means K means的目标是将样本集划分为K个簇,使得同一个簇内样本的距离尽可能阅读全文
posted @ 2018-08-06 17:53 massquantity 阅读(98) 评论(0) 编辑
摘要: "机器学习之类别不平衡问题 (1) —— 各种评估指标" "机器学习之类别不平衡问题 (2) —— ROC和PR曲线" 机器学习之类别不平衡问题 (3) —— 采样方法 前两篇主要谈类别不平衡问题的评估方法,重心放在各类评估指标以及ROC和PR曲线上,只有在明确了这些后,我们才能据此选择具体的处理类阅读全文
posted @ 2018-07-28 19:12 massquantity 阅读(124) 评论(0) 编辑
摘要: 前段时间参加了Kaggle上的 "Mercari Price Suggestion Challenge" 比赛,收获良多,过些时候准备进行一些全面的总结,本篇文章先谈一个比赛中用到的小技巧。 这个比赛数据中有一个特征叫做 " item_description ",大致是一些商品描述,比如什么时候买的阅读全文
posted @ 2018-07-08 19:00 massquantity 阅读(27) 评论(0) 编辑
摘要: EM算法及其应用(一) "EM算法及其应用(二): K means 与 高斯混合模型 " EM算法是期望最大化 (Expectation Maximization) 算法的简称,用于含有隐变量的情况下,概率模型参数的极大似然估计或极大后验估计。EM算法是一种迭代算法,每次迭代由两步组成:E步,求期望阅读全文
posted @ 2018-07-04 18:36 massquantity 阅读(224) 评论(0) 编辑
摘要: "官方网站" "官方代码" 第三章 查找 3.1 符号表 (Symbol Tables) 符号表是一种存储键值对 (key value pairs) 的数据结构,其主要目的是将键 (key) 和值 (value) 联系起来。主要支持两种操作:插入 (put) ,即将一组新的键值对存入存入表中;查找 阅读全文
posted @ 2018-07-01 19:23 massquantity 阅读(47) 评论(0) 编辑
摘要: "集成学习之Boosting —— AdaBoost原理" "集成学习之Boosting —— AdaBoost实现" 集成学习之Boosting —— Gradient Boosting原理 "集成学习之Boosting —— Gradient Boosting实现" 上一篇介绍了AdaBoost阅读全文
posted @ 2018-06-13 17:34 massquantity 阅读(181) 评论(1) 编辑
摘要: Gradient Boosting的一般算法流程 1. 初始化: $f_0(x) = \mathop{\arg\min}\limits_\gamma \sum\limits_{i=1}^N L(y_i, \gamma)$ 2. for m=1 to M: (a) 计算负梯度: $\tilde{y}_阅读全文
posted @ 2018-06-11 19:13 massquantity 阅读(63) 评论(0) 编辑
摘要: "官方网站" "官方代码" 第二章 排序 2.1 初级排序算法 排序就是将一组对象按照某种逻辑顺序重新排列的过程。这里我们主要关注重新排列 含有元素的数组 (arrays of items) 的算法,其中每个元素都有一个 主键 (key) 。排序算法的目的是重新排列所有元素,使得元素的主键能以某种方阅读全文
posted @ 2018-06-01 21:19 massquantity 阅读(48) 评论(0) 编辑
摘要: 集成学习之Boosting —— AdaBoost原理 "集成学习之Boosting —— AdaBoost实现" "集成学习之Boosting —— Gradient Boosting原理" "集成学习之Boosting —— Gradient Boosting实现" 集成学习大致可分为两大类:B阅读全文
posted @ 2018-05-20 12:36 massquantity 阅读(132) 评论(0) 编辑
摘要: "集成学习之Boosting —— AdaBoost原理" 集成学习之Boosting —— AdaBoost实现 AdaBoost的一般算法流程 输入: 训练数据集 $T = \left \{(x_1,y_1), (x_2,y_2), \cdots (x_N,y_N)\right \}$,$y\i阅读全文
posted @ 2018-05-19 20:21 massquantity 阅读(48) 评论(0) 编辑