摘要:
参考这篇文章: https://mp.weixin.qq.com/s?__biz=MzI1OTYwNDE2Mg==&mid=2247483753&idx=1&sn=acec759cf688e21660b61e791986bfac&chksm=ea772ac4dd00a3d239995c8e6b9e8 阅读全文
posted @ 2022-03-07 12:03
blcblc
阅读(90)
评论(0)
推荐(0)
摘要:
今天参考这篇文章: https://zhuanlan.zhihu.com/p/71986772 transformer系列模型的进展,从BERT到GPT2再到XLNet。然而随着模型体积增大,线上性能也越来越差,所以决定开一条新线,开始follow模型压缩之模型蒸馏的故事线。 0. 名词解释 tea 阅读全文
posted @ 2022-03-07 12:02
blcblc
阅读(498)
评论(0)
推荐(0)

浙公网安备 33010602011771号