摘要:
文章目录 transformer介绍为什么处理长序列时会出现梯度消失和梯度爆炸的问题transformer为什么可以用在图像处理上? transformer介绍 Transformer 是一种在深度学习中广泛使用的模型结构,最初由 Vaswani 等人在 “Attention is All You 阅读全文
摘要:
警告信息 warning: #188-D: enumerated type mixed with another type 这个警告说明你定义的变量是枚举类型,编译器推荐使用枚举元素进行赋值。 有时候会双击warning会跳到函数,其实是一样的,只不过经过函数包装而已,只需要把形参改为枚举元素就好了 阅读全文