2024年2月26日
摘要: 个人学习使用,内容来源于网络,侵权删 主要原因就是反向传播链式求导某项小于1(如使用sigmoid激活函数,其求导之后值\(\leq0.25\)),越深层次网络导数连乘越多,从而导致梯度消失,反之某项大于1会导致梯度爆炸,因此初始\(W\)过大会导致梯度爆炸。 如图所示,当\(\sigma\)激活函 阅读全文
posted @ 2024-02-26 16:57 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 个人学习所用,内容来源于网络,侵权删 1. CNN定义 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一 阅读全文
posted @ 2024-02-26 14:46 zhou-snaker 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 个人学习所用,内容来源于网络,侵权删。 1. 定义 损失函数是用来评价网络模型的输出的预测值\(\widehat{Y}=f(X)\)与真实值\(Y\)之间的差异,我们使用\(L(Y, \widehat{Y})\)来表示损失函数(非负实值函数),我们的目的是让损失函数尽可能小。 假设网络模型中有\(N 阅读全文
posted @ 2024-02-26 14:45 zhou-snaker 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 个人学习使用,内容来源于网络,侵权删 神经网络反向传播时参数朝着最小化损失的方向前进,确切说,是朝着梯度方向更新。设神经网络参数是\(W\),学习率是\(\alpha\),网络代表的函数是\(L(W)\),那么参数更新公式可表示为: $W=W-\alpha*\bigtriangledown_WL(W 阅读全文
posted @ 2024-02-26 14:44 zhou-snaker 阅读(4) 评论(0) 推荐(0) 编辑
  2024年2月21日
摘要: 个人学习所用,内容来源于网络,侵权删 1. 定义 激活函数(Activation functions)对于人工神经网络 模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用。它们将非线性特性引入到我们的网络中。如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这 阅读全文
posted @ 2024-02-21 11:10 zhou-snaker 阅读(31) 评论(0) 推荐(0) 编辑
摘要: (个人学习所用,内容来源于网络,侵权删) 猜测和检查 根据直觉选择一个超参数,看是否有效,持续进行。 网格搜索 设置一定范围均匀分布的一组值,挨个尝试。 随机搜索 让计算机随机挑选一组值。 贝叶斯优化 使用像MATLAB的bayesopt之类的工具来自动选择最佳参数,然后你会发现贝叶斯优化比你的机器 阅读全文
posted @ 2024-02-21 10:27 zhou-snaker 阅读(43) 评论(0) 推荐(0) 编辑
摘要: (个人学习所用,内容来源于网络,侵权删) 1. 感知机 感知机由Rosenblatt在1957年提出,是神经网络的基础,该思想受生物学启发(参照下图), 在其看来,人的大脑可以看作一个生物的神经网络,其最小的单元是神经元。人的神经网络由这样的一些神经元组成,它接受一些信号,这些信号可能是眼睛看到的光 阅读全文
posted @ 2024-02-21 09:48 zhou-snaker 阅读(13) 评论(0) 推荐(0) 编辑