(18)tensorflow误差loss简介
误差loss, E \Epsilon E
误差计算
E = g ( f θ ( x ) , y ) \Epsilon = g(f_\theta(x),y) E=g(fθ(x),y)
- f θ ( x ) f_\theta(x) fθ(x)为当前模型下y的预测值
- g ( . ) g(.) g(.)为误差的计算方式
优化目标
- 根据训练集计算,寻找一组 θ \theta θ使得loss最小
- 公式表达为: θ ∗ = a r g m i n g ( f θ ( x , y ) ) , x ∈ D t r a i n \theta^*=argmin\ \ g(f_\theta(x,y)), x \in D^{train} θ∗=argmin g(fθ(x,y)),x∈Dtrain
梯度下降法更新参数
θ
′
=
θ
−
η
∗
▽
θ
∗
E
\theta^{'} =\theta-\eta*\bigtriangledown_\theta*\Epsilon
θ′=θ−η∗▽θ∗E
η
\eta
η:学习率
▽
θ
\bigtriangledown_\theta
▽θ:梯度
E
\Epsilon
E:误差loss

浙公网安备 33010602011771号