2023 年 7月 11 日随笔档案 - 高颜值的殺生丸

2023年7月11日

我用numpy实现了VIT，手写vision transformer, 可在树莓派上运行，在hugging face上训练模型保存参数成numpy格式，纯numpy实现

摘要：先复制一点知乎上的内容按照上面的流程图，一个ViT block可以分为以下几个步骤 (1) patch embedding：例如输入图片大小为224x224，将图片分为固定大小的patch，patch大小为16x16，则每张图像会生成224x224/16x16=196个patch，即输入序列长度为阅读全文

posted @ 2023-07-11 15:42 高颜值的殺生丸阅读(335) 评论(0) 推荐(0)

点此进入CSDN

高颜值的殺生丸

博主擅长python和c++，从事人工智能领域自然语言处理和图像识别方面的工作，欢迎大家来讨论交流

作者信息

昵称：

园龄：4年6个月

粉丝：1209

QQ：522414928