主要讲一下什么叫接近驻点不平滑了:我们看一下关于\(w\)和\(b\)的梯度的式子,会发现前面的\(x^{(i)}\)是固定的,但是后面的符号函数要么是\(1\)要么是\(-1\),假设当符号函数里面的数值接近\(0\)的时候,符号函数的值就可能直接取相反数,这就会导致梯度变化很大;相反可以看看\(L_2\)损失函数,就是一个连续函数,所以是平滑的 Smooth \(L_1\)损失函数如下