02 2020 档案
摘要:词嵌入基础循环神经网络的从零开始实现中使用 ...
阅读全文
摘要:基于凸优化和梯度下降优化算法,进一步展开阐述...
阅读全文
摘要:温馨提示: 本文将介绍统计学中的优化知...
阅读全文
摘要:基于此前对于CNN的介绍Fundamenta...
阅读全文
摘要:双壁合一卷积神经网络(CNNS)Fundam...
阅读全文
摘要:Convolutional Neural N...
阅读全文
摘要:二维卷积层常用于处理图像数据。二维互相关运算...
阅读全文
摘要:Attention Mechanism注意力...
阅读全文
摘要:机器翻译(MT)_实践将一段文本从一种语言自...
阅读全文
摘要:学而后思梯度爆炸和梯度衰减问题深度模型有关数...
阅读全文
摘要:机器学习中模型训练是必需的,在模型训练中存在...
阅读全文
摘要:在循环神经网络的基础上进行了 RNN 的改进...
阅读全文
摘要:基于循环神经网络实现语言模型。对于语言模型的...
阅读全文
摘要:语言模型一段自然语言文本可以看作是一个离散时...
阅读全文
摘要:打开 Google, 输入搜索关键词,显示上百条搜索结果 打开 Google Translate, 输入待翻译文本,翻译结果框中显示出翻译结果 以上二者的共同点便是文本预处理 Pre-Processing 在 NLP 项目中,文本预处理占据了超过半数的时间,其重要性不言而喻。 当然 也可以利用完备且
阅读全文
摘要:MLP 以多层感知机为例,概述多层神经网络 隐藏层 此图为多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。 表达公式 具体来说,给定一个小批量样本X∈Rn×d\boldsymbol{X} \in \mathbb{R}^{n \times d}X∈Rn×d,其批量大小为nnn,输入个数
阅读全文
摘要:Softmax 与候选采样相对 Softmax function, a wonderful activation function that turns numbers aka logits into probabilities that sum to one. Softmax function o
阅读全文
摘要:线性回归的基本要素 模型 y=w⋅x+b \mathrm{y} = w \cdot \mathrm{x} + b y=w⋅x+b 数据集 我们在收集到的数据中寻找合适的模型参数来使模型的预测价格与真实价格的误差最小。被训练的数据的集合称为训练数据集(training data set)或训练集(tr
阅读全文

浙公网安备 33010602011771号