摘要: 通常在Caffe的网络定义中,某些layer会有如下参数: param{ lr_mult:x decay_mult:y } 当令lr_mult=x时,相当于该层的学习率为solver.prototxt中的base_lr*x; 特别地,当lr_mult=1时,相当于该层的学习率就是base_lr; 当 阅读全文
posted @ 2020-05-12 14:02 我们都是大好青年 阅读(538) 评论(0) 推荐(0)