摘要: 我们发现,MSE能够判断出来模型2优于模型1,那为什么不采样这种损失函数呢? 主要原因是在分类问题中,使用sigmoid/softmx得到概率,配合MSE损失函数时,采用梯度下降法进行学习时,会出现模型一开始训练时,学习速率非常慢的情况 使用MSE的一个缺点就是其偏导值在输出概率值接近0或者接近1的 阅读全文
posted @ 2022-03-18 17:41 wanna~ 阅读(1585) 评论(0) 推荐(0)
摘要: """ 批训练,把数据变成一小批一小批数据进行训练。 DataLoader就是用来包装所使用的数据,每次抛出一批数据 """ import torch import torch.utils.data as Data BATCH_SIZE = 3 x = torch.linspace(1, 10, 1 阅读全文
posted @ 2021-10-11 17:45 wanna~ 阅读(167) 评论(0) 推荐(0)