2023 年 2月随笔档案 - 老舍长

论文《Network Pruning via Transformable Architecture Search》

摘要：上图为传统的神经结构搜索算法与TAS的对比。整体的网络模型结构图，为每个通道设定一个超参数α（可更新），用于计算该通道可能被保留的概率，可视为该通道的贡献度。贡献度越大，被保留的概率越大。之后对每一层保留的通道数进行K次采样，如图中K=2个。如图中第一层，采样的通道数为3和4，则对前三个通道与P3 阅读全文

posted @ 2023-02-27 17:09 老舍长阅读(27) 评论(0) 推荐(0)

论文《Knowledge Distillation with the Reused Teacher Classifier》

摘要：在某种程度上，我们重用教师分类器的关键思想是与之前关于假设迁移学习 (HTL) 的研究有关。HTL 旨在利用学习到的源域分类器来帮助目标域分类器的训练，条件是只有少量标记的目标数据集并且没有可用的源数据集。 SimKD 的一个关键组成部分是“分类器重用”操作，即我们直接借用预训练的教师分类器进行学生阅读全文

posted @ 2023-02-24 15:23 老舍长阅读(23) 评论(0) 推荐(0)

论文《SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size》

摘要：在相同的精度下，较小的 CNN 架构至少提供了三个优势：（1）较小的 CNN 在分布式训练期间需要在服务器之间进行更少的通信。(2) 较小的 CNN 需要更少的带宽来将新模型从云端导出到自动驾驶汽车。(3)较小的cnn更容易部署在fpga和其他内存有限的硬件上。为了提供所有这些优势，我们提出了一种称阅读全文

posted @ 2023-02-24 12:22 老舍长阅读(30) 评论(0) 推荐(0)

jiawen0607

02 2023 档案

公告