会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
半夜打老虎
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
20
下一页
2025年4月7日
groupVIT
摘要: Paper: 《GroupViT: Semantic Segmentation Emerges from Text Supervision》 Code: https://github.com/NVlabs/GroupViT 一、大体内容 前面提到的LSeg只是借鉴CLIP利用文本编码器和图像编码器,
阅读全文
posted @ 2025-04-07 17:14 半夜打老虎
阅读(180)
评论(0)
推荐(0)
2025年3月19日
LSeg
摘要: Paper: 《LANGUAGE-DRIVEN SEMANTIC SEGMENTATION》 Code: https://github.com/isl-org/lang-seg 一、大体内容 前面CLIP中提到后续很多工作对其进行了扩展,本文提出了的LSeg 模型,就是借鉴CLIP利用文本编码器和图
阅读全文
posted @ 2025-03-19 11:24 半夜打老虎
阅读(146)
评论(0)
推荐(0)
2025年2月28日
CLIP
摘要: Paper: 《Learning Transferable Visual Models From Natural Language Supervision》 Code: https://github.com/openai/CLIP 一、大体内容 CLIP(Contrastive Language–I
阅读全文
posted @ 2025-02-28 13:18 半夜打老虎
阅读(179)
评论(0)
推荐(0)
2024年12月26日
用Detr训练自定义数据
摘要: 前面记录了Detr及其改进Deformable Detr。这一篇记录一下用Detr训练自己的数据集。先看下Detr附录中给出的大体源码,整体非常清晰。 接下来记录大体实现过程 一、数据准备 借助labelme对数据进行标注 然后将标注数据转换成COCO格式,得到以下几个文件 其中JPEGImages
阅读全文
posted @ 2024-12-26 22:13 半夜打老虎
阅读(763)
评论(0)
推荐(0)
2024年12月16日
Deformable DETR
摘要: PDF:https://arxiv.org/pdf/2010.04159 Code:https://github.com/fundamentalvision/Deformable-DETR 一、大体内容 前面介绍DETR时,说明了其还存在对小物体检测效果不佳和训练慢的问题,Deformable DE
阅读全文
posted @ 2024-12-16 17:12 半夜打老虎
阅读(1035)
评论(0)
推荐(0)
2024年12月6日
DETR
摘要: PDF: https://arxiv.org/pdf/2005.12872 Code: https://github.com/facebookresearch/detr 一、大体内容 DETR(DEtection TRansformer)基于Transformer提出了一个全新的端到端的目标检测框架
阅读全文
posted @ 2024-12-06 11:39 半夜打老虎
阅读(651)
评论(0)
推荐(0)
2024年11月29日
Swin Transformer
摘要: 一、大体内容 PDF:https://arxiv.org/pdf/2103.14030 CODE:https://github.com/microsoft/Swin-Transformer 前面提出的ViT将Transformer引入到了视觉领域,但其重点解决了分类问题,其采用单一尺度提取特征对后续
阅读全文
posted @ 2024-11-29 16:37 半夜打老虎
阅读(526)
评论(0)
推荐(0)
2024年11月22日
MAE
摘要: 一、大体内容 PDF: https://arxiv.org/abs/2111.06377 CODE: https://github.com/facebookresearch/mae (原文采用tensorflow 和 TPU 没有开源) 前面已经介绍了Transformer、BERT、ViT,这里理
阅读全文
posted @ 2024-11-22 17:19 半夜打老虎
阅读(147)
评论(0)
推荐(0)
2024年11月14日
VIT
摘要: PDF: https://arxiv.org/abs/2010.11929 CODE: https://github.com/google-research/vision_transformer 一、大体内容 前面介绍了Transformer及其在NLP领域的两大发展方向BERT和GPT,但当时Tr
阅读全文
posted @ 2024-11-14 15:45 半夜打老虎
阅读(248)
评论(0)
推荐(0)
2024年9月27日
Transformer两大发展方向——GPT系列及BERT(二)
摘要: 前面讲解了GPT、BERT相关内容,这一篇记录剩下GPT-2、GPT-3、GPT-4。 相关资料 GPT1: Improving Language Understanding by Generative Pre-Training GPT2: Language Models are Unsupervi
阅读全文
posted @ 2024-09-27 17:22 半夜打老虎
阅读(285)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
20
下一页
公告