摘要: 1. Transformer的框架 这段描述的基本结构涉及到了Transformer模型中的几个重要组成部分,下面对每个部分进行简要解释: 1. Embedding + Position Embedding Embedding层将输入的token转换为向量表示,通常是通过一个可学习的词嵌入矩阵将每个 阅读全文
posted @ 2025-05-09 18:34 赵家小伙儿 阅读(12) 评论(0) 推荐(0)
摘要: 1. NLP的发展脉络 1.1 文本表示方式的演进 要处理NLP问题,首先要解决文本的表示问题。虽然我们人去看文本,能够清楚明白文本中的符号表达什么含义,但是计算机只能做数学计算,需要将文本表示成计算机可以处理的形式。自然语言处理的核心是将“语言”转化为“模型可处理的向量”,其表示方式经历了如下演变 阅读全文
posted @ 2025-05-07 11:09 赵家小伙儿 阅读(31) 评论(0) 推荐(0)
摘要: 参考:https://blog.csdn.net/weixin_42392454/article/details/122667271 : ViT 的 pytorch实现代码: import torch from torch import nn from einops import rearrange 阅读全文
posted @ 2024-05-10 10:53 赵家小伙儿 阅读(26) 评论(0) 推荐(0)
摘要: 代码处理: 1 import os 2 3 def dayOrdark_TXT(): 4 path = 'D:/01_myWorkFile/02_VisDrone/04_datasets/VisDrone/VisDrone2019-DET-val/dark' 5 txtPath = 'D:/01_m 阅读全文
posted @ 2023-07-14 18:47 赵家小伙儿 阅读(69) 评论(0) 推荐(0)
摘要: 1. 小目标检测 https://github.com/52CV/WACV-2023-Papers https://www.cvmart.net/login?redirect=%2Fcommunity%2Fdetail%2F5300 https://zhuanlan.zhihu.com/p/3836 阅读全文
posted @ 2023-06-15 17:17 赵家小伙儿 阅读(50) 评论(0) 推荐(0)
摘要: 动态库dll工程下:testClass:的 testClass.h 1 #ifndef TEST_CLASS_H_ 2 #define TEST_CLASS_H_ 3 4 #include <iostream> 5 #include <string> 6 7 using namespace std; 阅读全文
posted @ 2023-05-22 15:42 赵家小伙儿 阅读(64) 评论(0) 推荐(0)
摘要: dx*pw 与系数有关系,而不是直接dx,原因是跟图像的大小有关系。 Faster R-cnn的关键点,就是利用RPN网络取代了Selective Search方法,减少耗时。 上采样方法:双线性插值、反卷积(有参数)、 阅读全文
posted @ 2023-02-20 20:27 赵家小伙儿 阅读(46) 评论(0) 推荐(0)
摘要: a:正负样本的比例设置的权值;Y是相等于像素点判断的类别的难易程度权值。 卷积:提取特征;池化:压缩特征;全连接层: padding:添加0,对于原图没有影响;填充其他数字的话,可能会对数据产生影响,故一般只填充0; 池化层:压缩特征或者降采样,(原图中,并不是所有的特征都很重要,对特征进行压缩后, 阅读全文
posted @ 2023-02-07 09:34 赵家小伙儿 阅读(44) 评论(0) 推荐(0)
摘要: 参考:https://zhuanlan.zhihu.com/p/143747206 dropblock理解:https://blog.csdn.net/qq_14845119/article/details/85103503 阅读全文
posted @ 2023-01-31 19:24 赵家小伙儿 阅读(26) 评论(0) 推荐(0)
摘要: 注:Anchor box、预测框、实际框三者之间的关系理解: 在目标检测任务中,通常会以某种规则在图片上生成一系列锚框,将这些锚框当成可能的候选区域。模型对这些候选区域是否包含物体进行预测,如果包含目标物体,则还需要进一步预测出物体所属的类别。还有更为重要的一点是,由于锚框位置是固定的,它不大可能刚 阅读全文
posted @ 2023-01-31 17:23 赵家小伙儿 阅读(150) 评论(0) 推荐(0)