摘要:
什么是TextCNN Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN,该模型将卷积神经网络CNN应用到文本分类任务,是卷积神经网络应用到文本分析的开创性工作之⼀。 T 阅读全文
posted @ 2021-01-23 12:55
1033020837
阅读(357)
评论(0)
推荐(0)
摘要:
什么是FastText FastText是Facebook于2016年开源的一个词向量计算和文本分类工具,它提出了子词嵌入的方法,试图在词嵌入向量中引入构词信息。一般情况下,使用fastText进行文本分类的同时也会产生词的embedding,即embedding是fastText分类的产物。 Fa 阅读全文
posted @ 2021-01-22 16:20
1033020837
阅读(572)
评论(0)
推荐(0)
摘要:
什么是GloVe GloVe(Global Vectors for Word Representation)是一个基于全局词频统计(count-based & overall statistics)的词表征(word representation)工具,它可以把一个单词表达成一个由实数组成的向量,这 阅读全文
posted @ 2021-01-22 13:36
1033020837
阅读(1046)
评论(0)
推荐(0)
摘要:
词嵌入要解决什么问题 在自然语言系统中,词被看作最为基本的单元,如何将词进行向量化表示是一个很基本的问题,词嵌入(word embedding)就是把词映射为低维实数域向量的技术。 下面先介绍几种词的离散表示技术,然后总结其缺点,最后介绍词的分布式表示及其代表技术(word2vec)。 词的离散表示 阅读全文
posted @ 2021-01-21 16:15
1033020837
阅读(647)
评论(0)
推荐(0)
摘要:
LSTM简介 LSTM是RNN的一种变体,引入了门控单元,旨在减缓RNN中的梯度消失现象,使得模型能够建模长距离的依赖关系。LSTM的结构图如下: 对比原始的RNN,LSTM中存在两种在不同时刻间传递的状态,分别为单元状态$c_t$以及隐藏状态$h_t$,其中$c_t$被用于保存长期记忆。 LSTM 阅读全文
posted @ 2021-01-20 13:03
1033020837
阅读(537)
评论(0)
推荐(0)
摘要:
什么是RNN RNN(循环神经网络)是一种用于处理时序数据的特殊结构的神经网络。所谓时序数据,是指句子、语音、股票这类具有时间顺序或者是逻辑顺序的序列数据。 RNN的折叠图和展开图为: RNN的参数为U、W和V三个矩阵,其中U为输出到隐藏层的参数矩阵,W为上一个时刻到当前时刻的参数矩阵,V为隐藏层到 阅读全文
posted @ 2021-01-18 21:48
1033020837
阅读(498)
评论(0)
推荐(0)
摘要:
什么是神经网络 逻辑回归、感知机均只包含一个输入层以及一个输出层,只能处理线性可分问题。如果在输入层与输出层之间加入一层到多层的隐藏层,就会得到神经网络结构。 神经网络一般由输入层、隐藏层、输出层构成,下图展示了其一般结构: 隐藏层之所称之为隐藏层,是因为在训练集中,这些中间结点的准确值我们是不知道 阅读全文
posted @ 2021-01-12 21:36
1033020837
阅读(815)
评论(0)
推荐(0)
摘要:
为什么使用LSTM+CRF进行序列标注 直接使用LSTM进行序列标注时只考虑了输入序列的信息,即单词信息,没有考虑输出信息,即标签信息,这样无法对标签信息进行建模,所以在LSTM的基础上引入一个标签转移矩阵对标签间的转移关系进行建模。这一点和传统CRF很像,CRF中存在两类特征函数,一类是针对观测序 阅读全文
posted @ 2021-01-09 00:23
1033020837
阅读(525)
评论(0)
推荐(0)
摘要:
什么是XGBoost XGBoost是陈天奇等人开发的一个开源机器学习项目,高效地实现了GBDT算法并进行了算法和工程上的许多改进。XGBoost本质上还是一个GBDT,但是力争把速度和效率发挥到极致,所以叫X (Extreme) GBoosted。 先来举个例子,我们要预测一家人对电子游戏的喜好程 阅读全文
posted @ 2021-01-09 00:17
1033020837
阅读(427)
评论(0)
推荐(0)
摘要:
什么是随机森林 自助法(Bootstrap Method,Bootstrapping,或自助抽样法、拔靴法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。 Bagging思想 Bagging(bootstrap aggregating) 阅读全文
posted @ 2021-01-09 00:10
1033020837
阅读(507)
评论(0)
推荐(0)
浙公网安备 33010602011771号