随笔分类 - 自然语言处理
自然语言处理
摘要:论文:《MZNT: Memory Augmented Zero Shot Fine grained Named Entity Typing》 一、概述 命名实体分类(Named entity typing, NET)旨在推断文本中实体指称的语义类型。比如给定句子"John plays piano o
阅读全文
摘要:基本原理 损失函数 (线性链)CRF通常用于序列标注任务,对于输入序列$x$和标签序列$y$,定义匹配分数: $$ s(x,y) = \sum_{i=0}^l T(y_i, y_{i+1}) + \sum_{i=1}^l U(x_i, y_i) $$ 这里$l$是序列长度,$T$和$U$都是可学习的
阅读全文
摘要:这是一篇发表在ICLR2019上的论文,并且还是ICLR2019的Best paper之一。该论文提出了能够学习树结构信息的 ON LSTM 模型,这篇论文的开源代码可以在 "GitHub" 找到。 自然语言都是层次结构的,小的单元(如词组)堆叠成大的单元(如子句)。当一个大的成分结束时,其内部的所
阅读全文
摘要:Word2vec基础 词嵌入的假设,是通过一个词所在的上下文可以获得词的语义甚至语法结构,有相似上下文的词在向量空间中是邻近的点。 背景概念 Word2Vec要解决的根本问题,说到底是自然语言处理的问题。一般认为自然语言处理模型氛围两大派系,分别是形式文法和统计语言模型 统计语言模型 简单地说,可以
阅读全文

浙公网安备 33010602011771号