Dropout：随机失活

1. Dropout：是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃（使其暂时不工作），使一部分神经元工作，使另一部分神经元不工作；没有被删除的部分的参数得到更新，被删除的神经元参数保持之前的状态，此次训练过程中暂时不参加神经网络的计算，不更新权值，以达到避免过拟合，增加模型泛化的目的

△实质：让每个神经元的激活函数的输出值（激活函数值）以p的概率保持原样，以1-p的概率等于0

①在训练阶段，每个神经单元以概率p被保留，以1-p的概率被丢弃

②在测试阶段，每个神经单元都是存在的，激活函数输出值要乘以p，即[ f（W*x+b）]*p （有的博客说是权值矩阵W*p 不知道这两者有什么联系？）

一般p=0.5，使其激活函数值=0：

每次都是随机失活：

训练阶段以p的概率被保留；测试阶段（W*x + b）*p：

2. Dropout的运行：（训练阶段）一般p=0.5

①首先随机（临时）删掉网络中一半的隐藏神经元，输入输出神经元保持不变

②将输入x通过修改后的网络进行前向传播，然后把得到的损失结果通过修改的网络反向传播；1个batch执行完这个过程后，在没有被删除的神经元上按照SGD更新对应的参数W、b

③然后继续重复这一过程，直到训练结束：

（1）恢复被删掉的神经元 -- 被删除的神经元保持原样，而没有被删除的神经元已经有所更新
（2）从隐藏层神经元中随机选择一个一半大小的子集临时删除掉，备份被删除神经元的参数
（3）对1个batch，先前向传播然后反向传播损失并根据随机梯度下降法更新参数（w，b）- 没有被删除的那一部分参数得到更新，删除的神经元参数保持之前的状态

虚线为部分临时被删除的神经元：