深度学习基础

一、神经网络与多层感知机

人工神经元：人类神经元中抽象出来的数学模型

人工神经网络：大量神经元以某种连接方式构成的机器学习模型

多层感知机：层级神级网络基础上引入一个或多个隐藏层

前向传播：输入层数据不断向前传播最后输出

激活函数：无激活函数，网络退化为单层网络

反向传播：损失函数开始从后向前，梯度逐步传递至第一层

损失函数：衡量模型输出与真实标签的差异

学习率：控制更新步长

梯度：一个向量，方向为方向导数取得最大值的方向，梯度下降法

正则化方法：

池化：一个像素表示一块区域的像素值，降低图像分辨率
一块区域像素如何被一个像素代替：
- 方法1: Max Pooling，取最大值
- 方法2: Average Pooling，取平均值输出尺寸计算与卷积操作类似
注意：池化层无可学习参数
池化作用：
- 缓解卷积层对位置的过度敏感
- 减少冗余
- 降低图像分辨率，从而减少参数量

？

序列数据是常见的数据类型，前后数据通常具有关联性

语言模型计算序列概率

隐藏状态：用于记录历史信息，有效处理数据的前后关联性激活函数采用 Tanh ，将输出值域限制在 [ - 1 , 1 ] ，防止数值呈指数级变化

RNN特性：

缓解RNN梯度消失带来的问题，引入门概念，来控制信息流动，使模型更好的记住长远时期的信息，并缓解梯度消失

posted @ 2021-10-15 13:26 一笑风生阅读(234) 评论(0) 收藏举报

刷新页面返回顶部