kZjPBD.jpg

修改optimizer的 学习率


def step(self): "Update parameters and rate" self._step += 1 rate = self.rate() for p in self.optimizer.param_groups: p['lr'] = rate self._rate = rate self.optimizer.step()

param———groups 代表了有几组需要优化的网络,用在同时优化多个网络的情形。


print("optimizer_3.defaults:", trainer.defaults)
print("optimizer_3.param_groups长度:", len(trainer.param_groups))
print("optimizer_3.param_groups一个元素包含的键:", trainer.param_groups[0].keys())

optimizer_3.defaults: {'lr': 0.5, 'momentum': 0, 'dampening': 0, 'weight_decay': 0.001, 'nesterov': False}
optimizer_3.param_groups长度: 2
optimizer_3.param_groups一个元素包含的键: dict_keys(['params', 'lr', 'momentum', 'dampening', 'weight_decay', 'nesterov'])


trainer= torch.optim.SGD([{'params': params_1x},
{'params': net.fc.parameters(),'lr': learning_rate * 10}],lr=learning_rate, weight_decay=0.001)

这里看出向traine中传递力两组的param,由于第一组没有设置‘lr’,因此使用了defaults中的‘lr‘

posted @ 2022-04-03 16:13  Through_The_Night  阅读(111)  评论(0编辑  收藏  举报