摘要:
anchor(锚框)就是“RPN 在特征图上预先放好的一组固定大小、固定长宽比的矩形框模板”,用来**“捞”出可能包含物体的区域。 一句话理解:anchor ≠ 最终候选框,它只是“初始滑窗”,网络会在此基础上学出真正的框。 长什么样对每个空间位置(i, j)默认放 k 个 anchor: 3 种面 阅读全文
posted @ 2025-11-23 19:32
yinghualeihenmei
阅读(6)
评论(0)
推荐(0)
摘要:
候选区域 = “可能包含物体的矩形框”,也叫 Region Proposal / 候选框。 怎么来的 早期 Selective Search:在彩色、纹理、边缘上聚类合并超像素,生成 1k~2k 个框。 Faster R-CNN:用 RPN(Region Proposal Network)在特征图上 阅读全文
posted @ 2025-11-23 19:26
yinghualeihenmei
阅读(12)
评论(0)
推荐(0)
摘要:
128×128×256 的“分辨率”就是 128×128 像素(宽 128,高 128)。 分辨率就是一张图里“有多少个像素”,也叫空间分辨率。 用“宽 × 高”表示,单位是像素(pixel)。例:1920 × 1080 表示宽 1920 个像素、高 1080 个像素,总共约 207 万像素。 最后 阅读全文
posted @ 2025-11-23 19:15
yinghualeihenmei
阅读(19)
评论(0)
推荐(0)
摘要:
多尺度特征图就是 “同一张输入图,在网络不同深度得到的一组空间分辨率不同、语义级别不同的特征图”。 为什么需要它 小目标 → 需要高分辨率特征(细节多) 大目标 → 需要大感受野、高语义特征(上下文多)单尺度图只能顾一头,多尺度才能同时抓大和小。 怎么来的(以 CNN 为例) 下采样自然产生224× 阅读全文
posted @ 2025-11-23 19:10
yinghualeihenmei
阅读(14)
评论(0)
推荐(0)
摘要:
核心差别只有一点:“预训练”的权重已经在大规模数据上收敛过一次,而普通(从零开始)网络的权重仍是随机分布的。 除此之外,网络结构、前向计算、参数量、输入输出格式完全一样;差异只体现在“权重的初始状态”和随之而来的: 特征质量预训练 CNN 的低层边缘/纹理、中层部件、高层语义都已在百万级图片上统计出 阅读全文
posted @ 2025-11-23 18:47
yinghualeihenmei
阅读(25)
评论(0)
推荐(0)
摘要:
不是。Faster R-CNN 的 Backbone 在“前向推理阶段”只收一张裸图(像素矩阵),任何标注(框、类、掩码)都不进网络。标注只在“训练阶段计算损失”时用到,而且只跟 RPN 和 RoI Head 打交道,Backbone 本身仍然只看图。 流程一句话: 输入:裸图 Backbone:输 阅读全文
posted @ 2025-11-23 18:43
yinghualeihenmei
阅读(6)
评论(0)
推荐(0)
摘要:
自注意力机制(Self-Attention Mechanism),也称为内部注意力机制(Intra-Attention Mechanism),是一种在深度学习模型中,特别是在自然语言处理(NLP)和计算机视觉(CV)任务中广泛使用的注意力机制。它允许模型在处理序列数据时,对序列内部的不同位置进行加权 阅读全文
posted @ 2025-11-23 18:05
yinghualeihenmei
阅读(13)
评论(0)
推荐(0)
摘要:
多层感知机(Multilayer Perceptron, MLP) 是深度学习的基础架构,由多层神经元组成的前馈神经网络,能够学习复杂的非线性映射关系,被誉为深度学习的"万能积木"。 一、核心结构:三层架构 层次组成 输入层 → 隐藏层 → 输出层 ↑ ↑↑↑ ↑(特征) (非线性变换) (预测结果 阅读全文
posted @ 2025-11-17 17:53
yinghualeihenmei
阅读(34)
评论(0)
推荐(0)
摘要:
语义分割技术详解 语义分割(Semantic Segmentation) 是计算机视觉的核心任务,目标是为图像中的每个像素分配一个类别标签,实现像素级的精确理解。简单来说,就是让计算机"看懂"图像中每个像素是什么物体。 一、核心概念:从分类到分割 任务对比 | 任务类型 | 粒度 | 输出 | 示例 阅读全文
posted @ 2025-11-17 17:43
yinghualeihenmei
阅读(15)
评论(0)
推荐(0)
摘要:
径向基函数概率神经网络(Radial Basis Function Probabilistic Neural Network, RBF-PNN)通常指概率神经网络(PNN),因其核心就是使用高斯径向基函数作为核函数。这是一种基于贝叶斯决策理论和核密度估计的神经网络,特别适合分类问题。核心思想:用"相 阅读全文
posted @ 2025-11-11 23:55
yinghualeihenmei
阅读(20)
评论(0)
推荐(0)
浙公网安备 33010602011771号