时间又不会为我赖着不走, 干嘛停下来为了选择头疼

编程匠心者

厚德 求真 励学 笃行
诚朴 雄伟 励学 敦行

随笔分类 -  NLP

自然语言处理
摘要:Introduction 在transformer model出现之前,主流的sequence transduction model是基于循环或者卷积神经网络,表现最好的模型也是用attention mechanism连接基于循环神经网络的encoder和decoder. Transformer m 阅读全文
posted @ 2019-12-07 12:50 编程匠心者 阅读(1311) 评论(0) 推荐(0)
摘要:代码放在github上: "click me" 一、数据说明 数据集为英文语料集,一共包含20种类别的邮件,除了类别soc.religion.christian的邮件数为997以外每个类别的邮件数都是1000。每份邮件内部包含发送者,接受者,正文等信息。 二、实验方法 2.1 数据预处理 数据预处理 阅读全文
posted @ 2019-09-02 16:52 编程匠心者 阅读(1062) 评论(0) 推荐(0)
摘要:详细代码已上传到github: click me 摘 要: 情感分类是对带有感情色彩的主观性文本进行分析、推理的过程,即分析说话人的态度,推断其所包含的情感类别.传统机器学习在处理情感分类问题的时候通常是基于SVM、CRF、信息熵等传统算法,其优势在于具有对多种特征建模的能力,但要用人工标注的单个词 阅读全文
posted @ 2019-06-27 11:01 编程匠心者 阅读(4715) 评论(4) 推荐(0)
摘要:已迁移到我新博客,阅读体验更佳 "seg:NLP之正向最大匹配分词" 完整代码实现放在我的github上: "click me" 一、任务要求 实现一个基于词典与规则的汉语自动分词系统。 二、技术路线 采用正向最大匹配(FMM)方法对输入的中文语句进行分词,具体的实现可以分为下面几个步骤: 1. 对 阅读全文
posted @ 2019-04-24 23:10 编程匠心者 阅读(702) 评论(0) 推荐(0)
摘要:已迁移到我新博客,阅读体验更佳 "token:NLP之词形还原" 完整代码实现放在我的github上: "click me" 一、任务描述 形态还原算法: 1. 输入一个单词 2. 如果词典里有该词,输出该词及其属性,转4,否则,转3 3. 如果有该词的还原规则,并且,词典里有还原后的词,则输出还原 阅读全文
posted @ 2019-04-24 23:08 编程匠心者 阅读(1822) 评论(0) 推荐(0)
摘要:已迁移到我新博客,阅读体验更佳 "parsing:NLP之chart parser句法分析器" 完整代码实现放在我的github上: "click me" 一、任务要求 实现一个基于简单英语语法的chart句法分析器。 二、技术路线      &nb 阅读全文
posted @ 2019-04-24 23:07 编程匠心者 阅读(2636) 评论(0) 推荐(0)
摘要:我实现了LDA的java和python版本,其中python有直接调用sklearn API的也有自己直接手撸的 完整代码实现与训练数据: "click me" 阅读全文
posted @ 2019-01-18 21:35 编程匠心者 阅读(484) 评论(0) 推荐(0)
摘要:完整代码实现及训练与测试数据: "click me" 一、任务描述         自然语言通顺与否的判定,即给定一个句子,要求判定所给的句子是否通顺。 二、问题探索与分析      阅读全文
posted @ 2019-01-18 19:41 编程匠心者 阅读(8092) 评论(0) 推荐(2)