摘要: 三个月之前 NLP 课程结课,我们做的是命名实体识别的实验。在MSRA的简体中文NER语料(我是从这里下载的,非官方出品,可能不是SIGHAN 2006 Bakeoff-3评测所使用的原版语料)上训练NER模型,识别人名、地名和组织机构名。尝试了两种模型:一种是手工定义特征模板后再用CRF++开源包阅读全文
posted @ 2017-10-08 20:52 Determined22 阅读(46357) 评论(11) 编辑
摘要: 本文简述了以下内容: 神经概率语言模型NPLM,训练语言模型并同时得到词表示 word2vec:CBOW / Skip-gram,直接以得到词表示为目标的模型 (一)原始CBOW(Continuous Bag-of-Words)模型 (二)原始Skip-gram模型 (三)word analogy 阅读全文
posted @ 2016-08-25 03:16 Determined22 阅读(15459) 评论(6) 编辑
摘要: 三个月之前 NLP 课程结课,我们做的是命名实体识别的实验。在MSRA的简体中文NER语料(我是从这里下载的,非官方出品,可能不是SIGHAN 2006 Bakeoff-3评测所使用的原版语料)上训练NER模型,识别人名、地名和组织机构名。尝试了两种模型:一种是手工定义特征模板后再用CRF++开源包阅读全文
posted @ 2017-10-08 20:52 Determined22 阅读(46357) 评论(11) 编辑
摘要: LSA(Latent semantic analysis,隐性语义分析)、pLSA(Probabilistic latent semantic analysis,概率隐性语义分析)和 LDA(Latent Dirichlet allocation,隐狄利克雷分配)这三种模型都可以归类到话题模型(To阅读全文
posted @ 2017-07-26 09:13 Determined22 阅读(2532) 评论(0) 编辑
摘要: 在上一篇博客中介绍的论文“Show and tell”所提出的NIC模型采用的是最“简单”的encoder-decoder框架,模型上没有什么新花样,使用CNN提取图像特征,将Softmax层之前的那一层vector作为encoder端的输出并送入decoder中,使用LSTM对其解码并生成句子。模阅读全文
posted @ 2017-06-07 02:18 Determined22 阅读(13573) 评论(2) 编辑
摘要: 本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常浅,基于 [1] 和 [5] 梳理。感觉 [1] 的讲解很适合完全不知道什么是CRF的人来入门。如果阅读全文
posted @ 2017-05-31 02:04 Determined22 阅读(23878) 评论(3) 编辑
摘要: 本文简单整理了以下内容: (一)贝叶斯网(Bayesian networks,有向图模型)简单回顾 (二)隐马尔可夫模型(Hidden Markov model,HMM) 写着写着还是写成了很规整的样子。以后可能会修改。 (一)贝叶斯网简单回顾 图模型(PGM)根据边是否有向,可以分为有向图模型和无阅读全文
posted @ 2017-05-30 16:43 Determined22 阅读(11152) 评论(3) 编辑
摘要: 看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字。这项任务要求模型可以识别图片中的物体、理解物体间的关系,并用一句自然语言表达出来。 应用场景:比如说用户在拍了一张照片后,利用阅读全文
posted @ 2017-05-28 07:54 Determined22 阅读(14543) 评论(0) 编辑
摘要: 这篇总结继续复习分类问题。本文简单整理了以下内容: (一)线性判别函数与广义线性判别函数 (二)感知器 (三)松弛算法 (四)Ho-Kashyap算法 闲话:本篇是本系列[机器学习基础整理]在timeline上最新的,但实际上还有(七)、(八)都发布的比这个早,因为这个系列的博客是之前早就写好的,不阅读全文
posted @ 2017-04-21 21:25 Determined22 阅读(2450) 评论(1) 编辑
摘要: 本文简单整理了以下内容: (一)线性回归 (二)二分类:二项Logistic回归 (三)多分类:Softmax回归 (四)广义线性模型 闲话:二项Logistic回归是我去年入门机器学习时学的第一个模型(忘记了为什么看完《统计学习方法》第一章之后直接就跳去了第六章,好像是对“逻辑斯蒂”这个名字很感兴阅读全文
posted @ 2017-04-21 21:21 Determined22 阅读(5961) 评论(0) 编辑
摘要: 本文简单整理了以下内容: (一)维数灾难 (二)特征提取——线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensionality) 维数灾难就是说当样本的维数增加时,若要保持与低维情形下相同的样本密度,所需要的样本数指数阅读全文
posted @ 2017-04-13 16:07 Determined22 阅读(3359) 评论(0) 编辑
摘要: 本文简述了以下内容: (一)生成式模型的非参数方法 (二)Parzen窗估计 (三)k近邻估计 (四)k近邻分类器(k-nearest neighbor,kNN) (一)非参数方法(Non-parametric method) 对于生成式模型(Generative model)来说,重要的地方在于类阅读全文
posted @ 2017-04-13 16:03 Determined22 阅读(3173) 评论(1) 编辑