会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
massquantity
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
下一页
2018年8月23日
运用深度学习进行文本生成
摘要: AI写诗?? AI创作小说?? 近年来人们时常听到这类新闻,听上去很不可思议,那么今天我们来一探究竟,这种功能是如何通过深度学习来实现的。 通常文本生成的基本策略是借助语言模型,这是一种基于概率的模型,可根据输入数据预测下一个最有可能出现的词,而文本作为一种序列数据 (sequence data),
阅读全文
posted @ 2018-08-23 06:57 massquantity
阅读(7959)
评论(0)
推荐(9)
2018年8月6日
EM算法及其应用: K-means 与 高斯混合模型
摘要: "EM算法及其应用(一)" EM算法及其应用(二): K means 与 高斯混合模型 上一篇阐述了EM算法的主要原理,这一篇来看其两大应用 —— K means 与 高斯混合模型,主要由EM算法的观点出发。 K means K means的目标是将样本集划分为K个簇,使得同一个簇内样本的距离尽可能
阅读全文
posted @ 2018-08-06 17:53 massquantity
阅读(10111)
评论(0)
推荐(0)
2018年7月28日
机器学习之类别不平衡问题 (3) —— 采样方法
摘要: "机器学习之类别不平衡问题 (1) —— 各种评估指标" "机器学习之类别不平衡问题 (2) —— ROC和PR曲线" 机器学习之类别不平衡问题 (3) —— 采样方法 " 完整代码 " 前两篇主要谈类别不平衡问题的评估方法,重心放在各类评估指标以及ROC和PR曲线上,只有在明确了这些后,我们才能据
阅读全文
posted @ 2018-07-28 19:12 massquantity
阅读(36480)
评论(2)
推荐(13)
2018年7月8日
使用Pandas: str.replace() 进行文本清洗
摘要: 前段时间参加了Kaggle上的 "Mercari Price Suggestion Challenge" 比赛,收获良多,过些时候准备进行一些全面的总结,本篇文章先谈一个比赛中用到的小技巧。 这个比赛数据中有一个特征叫做 " item_description ",大致是一些商品描述,比如什么时候买的
阅读全文
posted @ 2018-07-08 19:00 massquantity
阅读(14172)
评论(0)
推荐(0)
2018年7月4日
EM算法及其应用(一)
摘要: EM算法及其应用(一) "EM算法及其应用(二): K means 与 高斯混合模型 " EM算法是期望最大化 (Expectation Maximization) 算法的简称,用于含有隐变量的情况下,概率模型参数的极大似然估计或极大后验估计。EM算法是一种迭代算法,每次迭代由两步组成:E步,求期望
阅读全文
posted @ 2018-07-04 18:36 massquantity
阅读(6134)
评论(0)
推荐(3)
2018年7月1日
普林斯顿《算法》笔记(三)
摘要: 官方网站 官方代码 第三章 查找 3.1 符号表 (Symbol Tables) 符号表是一种存储键值对 (key-value pairs) 的数据结构,其主要目的是将键 (key) 和值 (value) 联系起来。主要支持两种操作:插入 (put) ,即将一组新的键值对存入存入表中;查找 (get
阅读全文
posted @ 2018-07-01 19:23 massquantity
阅读(841)
评论(0)
推荐(0)
2018年6月13日
集成学习之Boosting —— Gradient Boosting原理
摘要: 集成学习之Boosting —— AdaBoost原理 集成学习之Boosting —— AdaBoost实现 集成学习之Boosting —— Gradient Boosting原理 集成学习之Boosting —— Gradient Boosting实现 集成学习之Boosting —— XGB
阅读全文
posted @ 2018-06-13 17:34 massquantity
阅读(31259)
评论(5)
推荐(4)
2018年6月11日
集成学习之Boosting —— Gradient Boosting实现
摘要: Gradient Boosting的一般算法流程 初始化: \(f_0(x) = \mathop{\arg\min}\limits_\gamma \sum\limits_{i=1}^N L(y_i, \gamma)\) for m=1 to M: (a) 计算负梯度: \(\tilde{y}_i =
阅读全文
posted @ 2018-06-11 19:13 massquantity
阅读(3221)
评论(0)
推荐(1)
2018年6月1日
普林斯顿《算法》笔记(二)
摘要: # 官方网站 官方代码 第二章 排序 ##2.1 初级排序算法 排序就是将一组对象按照某种逻辑顺序重新排列的过程。这里我们主要关注重新排列含有元素的数组 (arrays of items)的算法,其中每个元素都有一个主键 (key)。排序算法的目的是重新排列所有元素,使得元素的主键能以某种方式排列。
阅读全文
posted @ 2018-06-01 21:19 massquantity
阅读(647)
评论(0)
推荐(0)
2018年5月20日
集成学习之Boosting —— AdaBoost原理
摘要: 集成学习之Boosting —— AdaBoost原理 集成学习之Boosting —— AdaBoost实现 集成学习之Boosting —— Gradient Boosting原理 集成学习之Boosting —— Gradient Boosting实现 集成学习大致可分为两大类:Bagging
阅读全文
posted @ 2018-05-20 12:36 massquantity
阅读(11077)
评论(2)
推荐(5)
上一页
1
2
3
4
5
下一页
公告