摘要: 我们发现,MSE能够判断出来模型2优于模型1,那为什么不采样这种损失函数呢? 主要原因是在分类问题中,使用sigmoid/softmx得到概率,配合MSE损失函数时,采用梯度下降法进行学习时,会出现模型一开始训练时,学习速率非常慢的情况 使用MSE的一个缺点就是其偏导值在输出概率值接近0或者接近1的 阅读全文
posted @ 2022-03-18 17:41 wanna~ 阅读(1585) 评论(0) 推荐(0)