2017年5月8日

PRML读书笔记——线性回归模型(上)

摘要: 本章开始学习第一个有监督学习模型——线性回归模型。"线性"在这里的含义仅限定了模型必须是 参数 的线性函数。而正如我们接下来要看到的,线性回归模型可以是输入变量$x$的非线性函数。 书中首先对回归问题给出了一个简短的不那么正式的定义: Given a training data set compri阅读全文

posted @ 2017-05-08 11:56 公子天 阅读(953) 评论(0) 编辑

PRML读书笔记——机器学习导论

摘要: 什么是模式识别(Pattern Recognition)? 按照Bishop的定义,模式识别就是用机器学习的算法从数据中挖掘出有用的pattern。 人们很早就开始学习如何从大量的数据中发现隐藏在背后的pattern。例如,16世纪的Kepler从他的老师Tycho搜集的大量有关于行星运动的数据中发阅读全文

posted @ 2017-05-08 11:55 公子天 阅读(6074) 评论(1) 编辑

2017年4月16日

深度学习开发环境搭建教程(Mac篇)

摘要: 本文将指导你如何在自己的Mac上部署Theano + Keras的深度学习开发环境。如果你的Mac不自带NVIDIA的独立显卡(例如15寸以下或者17年新款的Macbook。具体可以在“关于本机->系统报告->图形卡/显示器”里查看),那么你可能无法在这台Mac上使用GPU训练深度学习模型。不过这并不值得遗憾。事实上,我在自己的Macbook上(15-inch,Early 2013,NVIDIA ...阅读全文

posted @ 2017-04-16 16:37 公子天 阅读(7221) 评论(0) 编辑

2016年9月28日

Gensim进阶教程:训练word2vec与doc2vec模型

摘要: 本篇博客是Gensim的进阶教程,主要介绍用于词向量建模的word2vec模型和用于长文本向量建模的doc2vec模型在Gensim中的实现。 Word2vec Word2vec并不是一个模型——它其实是2013年Mikolov开源的一款用于计算词向量的工具。关于Word2vec更多的原理性的介绍,阅读全文

posted @ 2016-09-28 21:01 公子天 阅读(38025) 评论(2) 编辑

2016年9月26日

Gensim入门教程

摘要: What is Gensim? "Gensim" 是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的阅读全文

posted @ 2016-09-26 14:34 公子天 阅读(37039) 评论(1) 编辑

2016年8月24日

(Stanford CS224d) Deep Learning and NLP课程笔记(三):GloVe与模型的评估

摘要: 本节课继续讲授word2vec模型的算法细节,并介绍了一种新的基于共现矩阵的词向量模型——GloVe模型。最后,本节课重点介绍了word2vec模型评估的两种方式。 Skip gram模型 上节课,我们介绍了一个十分简单的word2vec模型。模型的目标是预测word $o$出现在另一个word $阅读全文

posted @ 2016-08-24 16:16 公子天 阅读(13770) 评论(0) 编辑

2016年7月31日

(Stanford CS224d) Deep Learning and NLP课程笔记(二):word2vec

摘要: 本节课将开始学习Deep NLP的基础——词向量模型。 背景 word vector是一种在计算机中表达word meaning的方式。在Webster词典中,关于meaning有三种定义: the idea that is represented by a word, phrase, etc. t阅读全文

posted @ 2016-07-31 21:38 公子天 阅读(5783) 评论(4) 编辑

2016年7月30日

(Stanford CS224d) Deep Learning and NLP课程笔记(一):Deep NLP

摘要: Stanford大学在2015年开设了一门Deep Learning for Natural Language Processing的课程,广受好评。并在2016年春季再次开课。我将开始这门课程的学习,并做好每节课的课程笔记放在博客上。争取做到每周一更吧。 本文是第一篇。 NLP简介 NLP,全名N阅读全文

posted @ 2016-07-30 18:01 公子天 阅读(6520) 评论(1) 编辑

2016年7月19日

word2vec前世今生

摘要: word2vec前世今生 2013年,Google开源了一款用于词向量计算的工具——word2vec,引起了工业界和学术界的关注。首先,word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练;其次,该工具得到的训练结果——词向量(word embedding),可以很好地度量词与词之间阅读全文

posted @ 2016-07-19 20:24 公子天 阅读(70192) 评论(5) 编辑

2016年5月8日

AlphaGo原理浅析

摘要: 论文笔记:Mastering the game of Go with deep neural networks and tree search 背景:完全信息博弈与MCTS算法 要完全弄清AlphaGo背后的原理,首先需要了解一下AI在博弈游戏中常用到的蒙特卡洛树搜索算法——MCTS。 在一个完全信阅读全文

posted @ 2016-05-08 17:12 公子天 阅读(19573) 评论(1) 编辑

导航

统计

公告