caffe中的学习率的衰减机制
根据 caffe/src/caffe/proto/caffe.proto 里面的文件,可以看到它有以下几种学习率的衰减速机制:
1. fixed: 在训练过程中,学习率不变;
2. step: 它的公式可以表示:![clip_image002[5] clip_image002[5]](http://images2017.cnblogs.com/blog/961754/201708/961754-20170807094125940-151973284.png) ,  所以呢,它的学习率的变化就像台价一样;step by step 的; 其中的 gamma 与 stepsize需要设置的;
,  所以呢,它的学习率的变化就像台价一样;step by step 的; 其中的 gamma 与 stepsize需要设置的;
3.exp : 表示指数型的;公式为:![clip_image002[7] clip_image002[7]](http://images2017.cnblogs.com/blog/961754/201708/961754-20170807094126643-2054400498.png) ;其中参数 gamma 需要设置;
;其中参数 gamma 需要设置;
4. inv : 它表示什么意思不知道啊; 公式为:![clip_image002[9] clip_image002[9]](http://images2017.cnblogs.com/blog/961754/201708/961754-20170807094127502-1469651060.png) ,其中参数 gamma 与 power 都需要设置;
,其中参数 gamma 与 power 都需要设置;
5.multistep: 它可以设置多个 stepvalue的值, 在prototxt里面也没有具体介绍, 它由参数 stepsize 与 stepvalue 决定; 它不是每时第刻都去计算 学习率,而是达到我们设定的stepvalue的时候,才去计算(根据方法2中的公式),然后更新学习率; stepvalue 可以设置多个的,下面是 stepvalue的定义;
183 repeated int32 stepvalue = 34;
6、 poly : 多项式衰减: 它的公式为:  ![clip_image002[11] clip_image002[11]](http://images2017.cnblogs.com/blog/961754/201708/961754-20170807094128080-1956926920.png) ,当到达最大次数时, 学习率变为了0;
,当到达最大次数时, 学习率变为了0;
 
                     
                    
                 
                    
                
 
![clip_image002[13] clip_image002[13]](http://images2017.cnblogs.com/blog/961754/201708/961754-20170807094128674-2002967575.png)
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号