摘要:
RNN模型: 激活函数采用tanh() LSTM(长短期记忆网络) LSTM通过增加三个门,激活函数sigmoid输出0到1之间的数值,0表示不允许通过,1表示允许通过。 通过门来增加前后序列间的关联关系。 输入门、输出门、遗忘门(长记忆、短记忆) GRU(Gated Recurrent Unit, 阅读全文
posted @ 2023-08-24 11:45
wangssd
阅读(100)
评论(0)
推荐(0)
摘要:
原文:https://blog.csdn.net/in546/article/details/119621649 激活函数激活函数是用来加入非线性因素的,因为线性模型的表达能力不够。引入非线性激活函数,可使深层神经网络的表达能力更加强大。 激活函数应满足: 非线性: 激活函数非线性时,多层神经网络可 阅读全文
posted @ 2023-08-24 11:39
wangssd
阅读(115)
评论(0)
推荐(0)
摘要:
序列标注(Sequence Tagging)是NLP中最基础的任务(输入序列和输出序列长度相等),应用十分广泛,如分词、词性标注(POS tagging)、命名实体识别(Named Entity Recognition,NER)、关键词抽取、语义角色标注(Semantic Role Labeling 阅读全文
posted @ 2023-08-24 11:10
wangssd
阅读(372)
评论(0)
推荐(0)
摘要:
Seq2Seq,就是指一般的序列到序列的转换任务,比如机器翻译、自动文摘等等,这种任务的特点是输入序列和输出序列是不对齐的,如果对齐的话,那么我们称之为序列标注,序列标注任务也可以理解为序列到序列的转换。 左边是输入的 encoder,它负责把输入(可能是变长的)编码为一个固定大小的向量,这个可选择 阅读全文
posted @ 2023-08-24 10:33
wangssd
阅读(172)
评论(0)
推荐(0)

浙公网安备 33010602011771号