2014 年 10月 12 日随笔档案 - 90Zeng

2014年10月12日

摘要：假设给定m个训练样本的训练集，用梯度下降法训练一个神经网络，对于单个训练样本(x,y)，定义该样本的损失函数：那么整个训练集的损失函数定义如下：第一项是所有样本的方差的均值。第二项是一个归一化项（也叫权重衰减项），该项是为了减少权连接权重的更新速度，防止过拟合。我们的目标是最小化关于W和 b 的函数... 阅读全文

posted @ 2014-10-12 23:34 90Zeng 阅读(3382) 评论(0) 推荐(0)

公告