Determined22

[置顶] DL4NLP —— 序列标注：BiLSTM-CRF模型做基于字的中文命名实体识别

摘要：三个月之前 NLP 课程结课，我们做的是命名实体识别的实验。在MSRA的简体中文NER语料（我是从这里下载的，非官方出品，可能不是SIGHAN 2006 Bakeoff-3评测所使用的原版语料）上训练NER模型，识别人名、地名和组织机构名。尝试了两种模型：一种是手工定义特征模板后再用CRF++开源包阅读全文

posted @ 2017-10-08 20:52 Determined22 阅读(66814) 评论(16) 推荐(18) 编辑

[置顶] DL4NLP——词表示模型（二）基于神经网络的模型：NPLM；word2vec（CBOW/Skip-gram）

摘要：本文简述了以下内容：神经概率语言模型NPLM，训练语言模型并同时得到词表示 word2vec：CBOW / Skip-gram，直接以得到词表示为目标的模型（一）原始CBOW(Continuous Bag-of-Words)模型（二）原始Skip-gram模型（三）word analogy 阅读全文

posted @ 2016-08-25 03:16 Determined22 阅读(18955) 评论(7) 推荐(3) 编辑

2020年9月15日

强化学习 —— 几种基础方法比较

摘要：这半年有几次机缘巧合的机会来给其他人科普强化学习的基本概念，我总体上是分成两部分来讲的：第一部分是强化学习背景和常用概念介绍；第二部分是 DQN、DDPG、PPO、SAC 四个算法的比较。这里分享一下第二部分的 slides。此外我最近比较关注离线强化学习（Batch Reinforcement 阅读全文

posted @ 2020-09-15 21:06 Determined22 阅读(1825) 评论(0) 推荐(0) 编辑

2017年7月26日

NLP —— 图模型（三）pLSA（Probabilistic latent semantic analysis，概率隐性语义分析）模型

摘要： LSA（Latent semantic analysis，隐性语义分析）、pLSA（Probabilistic latent semantic analysis，概率隐性语义分析）和 LDA（Latent Dirichlet allocation，隐狄利克雷分配）这三种模型都可以归类到话题模型（To 阅读全文

posted @ 2017-07-26 09:13 Determined22 阅读(7291) 评论(0) 推荐(0) 编辑

2017年5月31日

NLP —— 图模型（二）条件随机场（Conditional random field，CRF）

摘要：本文简单整理了以下内容：（一）马尔可夫随机场（Markov random field，无向图模型）简单回顾（二）条件随机场（Conditional random field，CRF）这篇写的非常浅，基于 [1] 和 [5] 梳理。感觉 [1] 的讲解很适合完全不知道什么是CRF的人来入门。如果阅读全文

posted @ 2017-05-31 02:04 Determined22 阅读(39045) 评论(5) 推荐(7) 编辑

2017年5月30日

NLP —— 图模型（一）隐马尔可夫模型（Hidden Markov model，HMM）

摘要：本文简单整理了以下内容：（一）贝叶斯网（Bayesian networks，有向图模型）简单回顾（二）隐马尔可夫模型（Hidden Markov model，HMM）写着写着还是写成了很规整的样子。以后可能会修改。（一）贝叶斯网简单回顾图模型（PGM）根据边是否有向，可以分为有向图模型和无阅读全文

posted @ 2017-05-30 16:43 Determined22 阅读(16615) 评论(4) 推荐(1) 编辑

2017年5月28日

Multimodal —— 看图说话（Image Caption）任务的论文笔记（一）评价指标和NIC模型

摘要：看图说话（Image Caption）任务是结合CV和NLP两个领域的一种比较综合的任务，Image Caption模型的输入是一幅图像，输出是对该幅图像进行描述的一段文字。这项任务要求模型可以识别图片中的物体、理解物体间的关系，并用一句自然语言表达出来。应用场景：比如说用户在拍了一张照片后，利用阅读全文

posted @ 2017-05-28 07:54 Determined22 阅读(24055) 评论(0) 推荐(1) 编辑

2017年4月21日

机器学习 —— 基础整理（六）线性判别函数：感知器、松弛算法、Ho-Kashyap算法

摘要：这篇总结继续复习分类问题。本文简单整理了以下内容：（一）线性判别函数与广义线性判别函数（二）感知器（三）松弛算法（四）Ho-Kashyap算法闲话：本篇是本系列［机器学习基础整理］在timeline上最新的，但实际上还有（七）、（八）都发布的比这个早，因为这个系列的博客是之前早就写好的，不阅读全文

posted @ 2017-04-21 21:25 Determined22 阅读(8189) 评论(2) 推荐(1) 编辑

机器学习 —— 基础整理（五）线性回归；二项Logistic回归；Softmax回归及其梯度推导；广义线性模型

摘要：本文简单整理了以下内容：（一）线性回归（二）二分类：二项Logistic回归（三）多分类：Softmax回归（四）广义线性模型闲话：二项Logistic回归是我去年入门机器学习时学的第一个模型（忘记了为什么看完《统计学习方法》第一章之后直接就跳去了第六章，好像是对“逻辑斯蒂”这个名字很感兴阅读全文

posted @ 2017-04-21 21:21 Determined22 阅读(10047) 评论(0) 推荐(2) 编辑

2017年4月13日

机器学习 —— 基础整理（四）特征提取之线性方法：主成分分析PCA、独立成分分析ICA、线性判别分析LDA

摘要：本文简单整理了以下内容：（一）维数灾难（二）特征提取——线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA （一）维数灾难（Curse of dimensionality）维数灾难就是说当样本的维数增加时，若要保持与低维情形下相同的样本密度，所需要的样本数指数阅读全文

posted @ 2017-04-13 16:07 Determined22 阅读(11380) 评论(0) 推荐(0) 编辑

机器学习 —— 基础整理（三）生成式模型的非参数方法： Parzen窗估计、k近邻估计；k近邻分类器

摘要：本文简述了以下内容：（一）生成式模型的非参数方法（二）Parzen窗估计（三）k近邻估计（四）k近邻分类器（k-nearest neighbor，kNN）（一）非参数方法（Non-parametric method）对于生成式模型（Generative model）来说，重要的地方在于类阅读全文

posted @ 2017-04-13 16:03 Determined22 阅读(8013) 评论(2) 推荐(1) 编辑

Ain't nothin' but a mistake

公告