摘要: AI写诗?? AI创作小说?? 近年来人们时常听到这类新闻,听上去很不可思议,那么今天我们来一探究竟,这种功能是如何通过深度学习来实现的。 通常文本生成的基本策略是借助语言模型,这是一种基于概率的模型,可根据输入数据预测下一个最有可能出现的词,而文本作为一种序列数据 (sequence data), 阅读全文
posted @ 2018-08-23 06:57 massquantity 阅读(7407) 评论(0) 推荐(9) 编辑
摘要: "EM算法及其应用(一)" EM算法及其应用(二): K means 与 高斯混合模型 上一篇阐述了EM算法的主要原理,这一篇来看其两大应用 —— K means 与 高斯混合模型,主要由EM算法的观点出发。 K means K means的目标是将样本集划分为K个簇,使得同一个簇内样本的距离尽可能 阅读全文
posted @ 2018-08-06 17:53 massquantity 阅读(9280) 评论(0) 推荐(0) 编辑
摘要: "机器学习之类别不平衡问题 (1) —— 各种评估指标" "机器学习之类别不平衡问题 (2) —— ROC和PR曲线" 机器学习之类别不平衡问题 (3) —— 采样方法 " 完整代码 " 前两篇主要谈类别不平衡问题的评估方法,重心放在各类评估指标以及ROC和PR曲线上,只有在明确了这些后,我们才能据 阅读全文
posted @ 2018-07-28 19:12 massquantity 阅读(33237) 评论(2) 推荐(13) 编辑
摘要: 前段时间参加了Kaggle上的 "Mercari Price Suggestion Challenge" 比赛,收获良多,过些时候准备进行一些全面的总结,本篇文章先谈一个比赛中用到的小技巧。 这个比赛数据中有一个特征叫做 " item_description ",大致是一些商品描述,比如什么时候买的 阅读全文
posted @ 2018-07-08 19:00 massquantity 阅读(13664) 评论(0) 推荐(0) 编辑
摘要: EM算法及其应用(一) "EM算法及其应用(二): K means 与 高斯混合模型 " EM算法是期望最大化 (Expectation Maximization) 算法的简称,用于含有隐变量的情况下,概率模型参数的极大似然估计或极大后验估计。EM算法是一种迭代算法,每次迭代由两步组成:E步,求期望 阅读全文
posted @ 2018-07-04 18:36 massquantity 阅读(5823) 评论(0) 推荐(3) 编辑
摘要: 官方网站 官方代码 第三章 查找 3.1 符号表 (Symbol Tables) 符号表是一种存储键值对 (key-value pairs) 的数据结构,其主要目的是将键 (key) 和值 (value) 联系起来。主要支持两种操作:插入 (put) ,即将一组新的键值对存入存入表中;查找 (get 阅读全文
posted @ 2018-07-01 19:23 massquantity 阅读(776) 评论(0) 推荐(0) 编辑
摘要: 集成学习之Boosting —— AdaBoost原理 集成学习之Boosting —— AdaBoost实现 集成学习之Boosting —— Gradient Boosting原理 集成学习之Boosting —— Gradient Boosting实现 集成学习之Boosting —— XGB 阅读全文
posted @ 2018-06-13 17:34 massquantity 阅读(29576) 评论(5) 推荐(4) 编辑
摘要: Gradient Boosting的一般算法流程 初始化: \(f_0(x) = \mathop{\arg\min}\limits_\gamma \sum\limits_{i=1}^N L(y_i, \gamma)\) for m=1 to M: (a) 计算负梯度: \(\tilde{y}_i = 阅读全文
posted @ 2018-06-11 19:13 massquantity 阅读(2998) 评论(0) 推荐(1) 编辑
摘要: # 官方网站 官方代码 第二章 排序 ##2.1 初级排序算法 排序就是将一组对象按照某种逻辑顺序重新排列的过程。这里我们主要关注重新排列含有元素的数组 (arrays of items)的算法,其中每个元素都有一个主键 (key)。排序算法的目的是重新排列所有元素,使得元素的主键能以某种方式排列。 阅读全文
posted @ 2018-06-01 21:19 massquantity 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 集成学习之Boosting —— AdaBoost原理 集成学习之Boosting —— AdaBoost实现 集成学习之Boosting —— Gradient Boosting原理 集成学习之Boosting —— Gradient Boosting实现 集成学习大致可分为两大类:Bagging 阅读全文
posted @ 2018-05-20 12:36 massquantity 阅读(10514) 评论(2) 推荐(5) 编辑