optimizer.zero_grad()

        # zero the parameter gradients
        optimizer.zero_grad()
        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0.

posted on 2019-08-15 19:47 Hebye 阅读(1850) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

optimizer.zero_grad()

导航

公告