论文《Movement Pruning: Adaptive Sparsity by Fine-Tuning》

论文提出里一种movement pruning,该方法将在训练的过程中同时更新模型权重和权重的重要分数,同时提出里两种修剪版本:硬和软。硬剪枝直接取前v%的权重,软剪枝则设定一个分数阈值,权重分数超过该阈值则选择保留。反向传播时,权重分数的梯度计算如下。

 

 L为损失函数,S为分数,W为权重,其中,M是Mask编码。

 

 

 图一时传统的幅度剪枝,着重与剪除权重值接近0的部分。图二是该论文的剪枝,能够剪去各个区域的权重(不关权重大小)。

开源代码:https://github.com/huggingface/block_movement_pruning

 

posted @ 2023-03-14 09:20  老舍长  阅读(160)  评论(0)    收藏  举报