摘要:
为什么是大 kernel 卷积? Transformer 目前在 CV 领域愈发火热,这份火热促使着优秀学者们思考一个更深层次的问题。部分学者认为 Transformer 之所以 work 更加本质的原因在于其大的感受野*(论文直达)*。根据有效感受野(ERF)理论,ERF 大小与 kernel 大 阅读全文
posted @ 2022-03-18 18:33
MegEngine
阅读(324)
评论(0)
推荐(0)
浙公网安备 33010602011771号