(18)tensorflow误差loss简介

误差loss, E \Epsilon E

误差计算

E = g ( f θ ( x ) , y ) \Epsilon = g(f_\theta(x),y) E=g(fθ(x),y)

  • f θ ( x ) f_\theta(x) fθ(x)为当前模型下y的预测值
  • g ( . ) g(.) g(.)为误差的计算方式

优化目标

  • 根据训练集计算,寻找一组 θ \theta θ使得loss最小
  • 公式表达为: θ ∗ = a r g m i n    g ( f θ ( x , y ) ) , x ∈ D t r a i n \theta^*=argmin\ \ g(f_\theta(x,y)), x \in D^{train} θ=argmin  g(fθ(x,y)),xDtrain

梯度下降法更新参数

θ ′ = θ − η ∗ ▽ θ ∗ E \theta^{'} =\theta-\eta*\bigtriangledown_\theta*\Epsilon θ=θηθE
η \eta η:学习率
▽ θ \bigtriangledown_\theta θ:梯度
E \Epsilon E:误差loss

posted @ 2020-09-04 15:29  kuanleung  阅读(29)  评论(0)    收藏  举报  来源