随笔分类 - NLP
自然语言处理
摘要:Introduction 在transformer model出现之前,主流的sequence transduction model是基于循环或者卷积神经网络,表现最好的模型也是用attention mechanism连接基于循环神经网络的encoder和decoder. Transformer m
阅读全文
摘要:代码放在github上: "click me" 一、数据说明 数据集为英文语料集,一共包含20种类别的邮件,除了类别soc.religion.christian的邮件数为997以外每个类别的邮件数都是1000。每份邮件内部包含发送者,接受者,正文等信息。 二、实验方法 2.1 数据预处理 数据预处理
阅读全文
摘要:详细代码已上传到github: click me 摘 要: 情感分类是对带有感情色彩的主观性文本进行分析、推理的过程,即分析说话人的态度,推断其所包含的情感类别.传统机器学习在处理情感分类问题的时候通常是基于SVM、CRF、信息熵等传统算法,其优势在于具有对多种特征建模的能力,但要用人工标注的单个词
阅读全文
摘要:已迁移到我新博客,阅读体验更佳 "seg:NLP之正向最大匹配分词" 完整代码实现放在我的github上: "click me" 一、任务要求 实现一个基于词典与规则的汉语自动分词系统。 二、技术路线 采用正向最大匹配(FMM)方法对输入的中文语句进行分词,具体的实现可以分为下面几个步骤: 1. 对
阅读全文
摘要:已迁移到我新博客,阅读体验更佳 "token:NLP之词形还原" 完整代码实现放在我的github上: "click me" 一、任务描述 形态还原算法: 1. 输入一个单词 2. 如果词典里有该词,输出该词及其属性,转4,否则,转3 3. 如果有该词的还原规则,并且,词典里有还原后的词,则输出还原
阅读全文
摘要:已迁移到我新博客,阅读体验更佳 "parsing:NLP之chart parser句法分析器" 完整代码实现放在我的github上: "click me" 一、任务要求 实现一个基于简单英语语法的chart句法分析器。 二、技术路线 &nb
阅读全文
摘要:我实现了LDA的java和python版本,其中python有直接调用sklearn API的也有自己直接手撸的 完整代码实现与训练数据: "click me"
阅读全文
摘要:完整代码实现及训练与测试数据: "click me" 一、任务描述 自然语言通顺与否的判定,即给定一个句子,要求判定所给的句子是否通顺。 二、问题探索与分析  
阅读全文

浙公网安备 33010602011771号