摘要: 论文地址:https://arxiv.org/abs/2102.08005 1 引言 传统CNN网络很难捕获长距离的依赖关系,而且一味的加深网络的深度会带来大量的计算冗余。 文章提出了一种并行分支的TransFuse网络,结合transformer和CNN两种网络架构,能同时捕获全局依赖关系和低水平 阅读全文
posted @ 2021-07-26 15:51 暮色渐浓 阅读(2067) 评论(0) 推荐(0)
摘要: 论文地址:https://arxiv.org/abs/2105.05633 1 引言 图像语义分割在单个图像块级别通常表现得比较模糊,文章提出了一种基于tansformer的语义分割模型,可以在网络传播过程中建模全局上下文信息。其网络结构是在ViT模型的基础上进行扩展,以适应语义分割任务。decod 阅读全文
posted @ 2021-07-26 13:17 暮色渐浓 阅读(1674) 评论(0) 推荐(0)
摘要: 论文地址:https://arxiv.org/abs/2105.15203 1 引言 文章提出了一种基于transformer的语义分割网络,不同于ViT模型,SegFormer使用一种分层特征表示的方法,每个transformer层的输出特征尺寸逐层递减,通过这种方式捕获不同尺度的特征信息。并且舍 阅读全文
posted @ 2021-07-22 13:20 暮色渐浓 阅读(3007) 评论(0) 推荐(0)
摘要: 文章链接:https://arxiv.org/abs/2012.15840 1 引言 传统的语义分割模型一般采用全卷积神经网络的设计,使用编解码结构。受限于CNN感受野过小,无法学习长程依赖信息,故而使用空洞卷积或者添加注意力模块的方法增大其感受野。但这在本质上并没有改变FCN的编码器模块下采样图像 阅读全文
posted @ 2021-07-21 13:09 暮色渐浓 阅读(776) 评论(0) 推荐(0)
摘要: 文章链接:https://arxiv.org/abs/2103.16110 Kaleido-BERT 引入了一种新颖的 kaleido 策略,基于transformer的时尚领域跨模态表示。同时设计了一种 alignment guided masking 策略,使模型更加关注图像-文本之间的语义关系 阅读全文
posted @ 2021-07-20 13:29 暮色渐浓 阅读(415) 评论(0) 推荐(0)
摘要: 前言 参考B站视频:https://www.bilibili.com/video/BV12J41137hu ##一、下载 下载地址:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html 选择Windows 阅读全文
posted @ 2021-06-03 11:34 暮色渐浓 阅读(149) 评论(0) 推荐(0)