2023 年 3月 19 日随笔档案 - bringlu

2023年3月19日

摘要： ViT 概括论文题目：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文地址：https://openreview.net/pdf?id=YicbFdNTTy 作者来自 Google 亮点: 一阅读全文

posted @ 2023-03-19 15:53 bringlu 阅读(450) 评论(0) 推荐(0)

简单测下C++20 vector array lambda 的常数

posted @ 2023-03-19 10:23 bringlu 阅读(39) 评论(0) 推荐(0)

李沐多模态串讲视频总结 ALBEF VLMo BLIP CoCa BEITv3 模型简要介绍

摘要：开场多模态串讲的上篇是比较传统的多模态任务多模态最后的模态交互很重要传统的缺点是都用了预训练的目标检测器，训练和部署都很困难。 ViLT 把预训练的目标检测器换成了一层的 Patch Embedding。因此容易比不过 c 类的方法 ViLT 训练很慢认为未来是 c 类的模型结构 Loss 阅读全文

posted @ 2023-03-19 08:36 bringlu 阅读(3502) 评论(0) 推荐(1)

Loading

bringlu

公告