读论文《Distilling the Knowledge in a Neural Network》——蒸馏网络 —— 蒸馏算法 —— 知识蒸馏 中的温度系数到底怎么用, temperature怎么用?
摘要:
论文地址: https://arxiv.org/pdf/1503.02531.pdf 蒸馏网络的重要公式: 其中,\(p^g\)为Teacher网络,\(q\)为Student网络。 个体神经网络(CNN模型): CNN层 + 全连接层(输出的是logits) + softmax层(输出的是预测值概 阅读全文
posted @ 2024-03-09 21:53
Angry_Panda
阅读(392)
评论(0)
推荐(0)
浙公网安备 33010602011771号