12 2025 档案
摘要:CRNN(Convolutional Recurrent Neural Network)是一种用于图像序列识别的端到端可训练神经网络,特别擅长处理场景文本识别任务 。CRNN 的核心架构包括三个主要部分:卷积层(CNN)、循环层(RNN)和转录层(Transcription Layer),结合 CT
阅读全文
摘要:MD-FPN 是一种优化的特征金字塔网络结构,旨在提高多尺度目标检测的性能。它通过引入多尺度预测融合和注意力机制,增强了特征提取能力 MD-FPN(Multi-Dilation Feature Pyramid Network)可以与 Faster R-CNN 结合使用,以提升模型对多尺度目标的检测能
阅读全文
摘要:Focal Loss 是一种用于解决类别不平衡问题的损失函数,特别适用于目标检测任务。在目标检测中,背景类别通常远多于目标类别,这导致模型在训练过程中对背景类别过度拟合,而忽视了目标类别。Focal Loss 通过调整损失函数的权重,使得模型更关注难以分类的样本,从而提高模型对目标类别的检测能力。
阅读全文
摘要:21.3 FPS(Frames Per Second)的实时处理能力”是指一个系统或模型能够在每秒处理大约21.3帧图像或视频数据。这个指标通常用于衡量计算机视觉模型(如目标检测、分割等)在实时应用中的性能。 21.3 FPS 的意义 实时性: 21.3 FPS 表示系统能够在大约每秒处理21.3帧
阅读全文
摘要:“收敛至约0.28”这个表述通常出现在描述模型训练过程中的某个指标(如损失函数值或准确率等)逐渐稳定并接近某个特定值(这里是0.28)的情况。具体含义取决于上下文,以下是一些可能的解释和应用场景: 1. 损失函数收敛至约0.28 在训练深度学习模型时,损失函数(Loss Function)是衡量模型
阅读全文
摘要:在深度学习中,冻结预训练层策略(Freezing Pre-trained Layers)是一种常见的技术,尤其是在使用预训练模型进行迁移学习(Transfer Learning)时。这种策略的核心思想是将预训练模型的一部分层(通常是早期层)冻结,即在训练过程中不更新这些层的权重,而只训练模型的其他部
阅读全文
摘要:学习率衰减策略(Learning Rate Decay)是深度学习中一种重要的技术,用于在训练过程中动态调整学习率。这种策略可以帮助模型在训练初期快速收敛,并在训练后期更精细地调整权重,从而提高模型的性能和泛化能力。 学习率衰减策略(Learning Rate Decay)的核心功能就是自动降低学习
阅读全文
摘要:在深度学习中,权重衰减(Weight Decay) 是一种常用的正则化技术,用于防止模型过拟合。它通过在损失函数中添加一个正则化项来限制模型的复杂度,从而提高模型的泛化能力。 权重衰减(Weight Decay)通常在整个训练过程中都使用,而不是仅在某个特定阶段。在 Faster R-CNN 的训练
阅读全文
摘要:在动量优化算法中,动量参数(通常用 β 表示)用于控制上一次梯度更新对当前更新的影响程度。动量参数的值在 0 到 1 之间,0.9 是一个常见的选择,它可以帮助优化算法更快地收敛,并且减少震荡。 动量(Momentum) 通常在整个训练过程中都使用,而不是仅在某个特定阶段。 在 Faster R-C
阅读全文
摘要:训练轮数(Epochs) = 完整遍历整个训练集的次数,是控制模型学习深度的核心超参数。 一、定义与计算 1个Epoch = 所有训练样本都参与一次梯度更新 Python 复制 # 示例:8000张图纸,batch_size=4 num_images = 8000 batch_size = 4 #
阅读全文
摘要:深度学习的"批量大小" Batch Size = 每次梯度更新时使用的训练样本数量。 梯度更新 = 参数更新,两者是同一过程的不同表述。 梯度更新发生在反向传播(Backward Pass)之后、优化器调用step()的瞬间。 作用于 Faster R-CNN 的所有可训练参数,而非某个特定模块内部
阅读全文
摘要:初始学习率 0.002 是 Faster R-CNN 精细微调场景下的保守配置,比标准值 0.02 小10倍,适用于迁移学习冻结Backbone或Warmup预热阶段。 一、0.002 的使用场景 场景1:分层学习率中的Backbone Python 复制 # Backbone微调慢,Head训练快
阅读全文
摘要:Anchor宽高比是Anchor的形状参数,与尺寸(Scale)共同决定每个候选框的具体高宽像素值。 通用场景(COCO) yaml 复制 # 3种比例覆盖大部分目标 ASPECT_RATIOS: [0.5, 1.0, 2.0] # 0.5: 高大于宽 (人、柱子) # 1.0: 正方形 (车辆、盘
阅读全文
摘要:Anchor尺寸 {16, 32, 64, 128} 是建筑图纸检测的极致精简配置,专为小目标密集+资源受限场景设计。 一、核心参数解码 Python 复制 # 对应FPN的4个层级 P3(stride=8): scale=16 → 实际尺寸 128×128px # 符号、标记 P4(stride=
阅读全文
摘要:统一管理所有可训练参数的更新,而非作用于某个局部模块。 一、全局视角:SGD管理哪些参数? Python 复制 # Faster R-CNN可训练参数总览 model = FasterRCNN( backbone=ResNet50(), # 包含 conv1~conv5_x, BN层 rpn=RPN
阅读全文
摘要:是的,但远不止改变图片大小这么简单。 一、尺度变换 = 改变图像分辨率 最直接的定义:将图像从原始尺寸(如 3000×2000)缩放到另一尺寸(如 800×600 或 4000×3000)。
阅读全文
摘要:在 IoU阈值从0.5到0.95 的范围内,每隔 0.05 计算一个AP,然后取平均值。 mAP@[.5:.95]=101IoU=0.5∑0.95APIoU 具体IoU阈值序列: [0.5,0.55,0.6,0.65,0.7,0.75,0.8,0.85,0.9,0.95] 共 10个 阈值点,
阅读全文
摘要:“与真实信号无关、可量化、可预测的随机扰动强度分布”;它既可以是统计标准差,也可以是模型残差,或物理采集误差,最终被画成一张“强度图”供算法使用。
阅读全文
摘要:1. CubiCasa5K 规模:5 000 张真实楼盘平面图 标注:SVG 多边形,80+ 类别(墙、门、窗、家具等);官方划分 train/val/test = 4200/400/400 特点:目前最大、最丰富的栅格平面图片集;分辨率 430×485 ~ 6316×14304 px;支持多任务(
阅读全文
摘要:GitHub 官方仓库(含数据集下载链接)https://github.com/CubiCasa/CubiCasa5k在该页面中可直接下载 5 000 张平面图及其 SVG 标注,并附有 PyTorch 多任务训练代码与 Docker 环境说明 。 Kaggle 镜像(需注册)https://www
阅读全文
摘要:YOLO 格式(Ultralytics 版)一行代表一个对象,共 5 列或更多: <class_id> <x_center> <y_center> <width> <height> 所有数值都是 归一化 的浮点数(0–1): 坐标 = 像素值 ÷ 图像宽高 框用 中心点 + 宽高 表示 类别编号从
阅读全文
摘要:ECA 注意力机制并不内嵌在 RoI Pooling 运算内部,而是套在 RoI Pooling 之前或之后的卷积特征图上,常见位置有两处: Backbone 侧(RoI Pooling 之前)在 Faster R-CNN 的 VGG/ResNet backbone 里,每个卷积块或 conv4_x
阅读全文
摘要:“把连续或大数值映射成离散或小数值” 的过程,在深度网络里主要有两条主线: 特征量化(常见于检测/分割的 RoI 系列) 把浮点坐标 四舍五入到整像素例:x=6.7 → 6,y=3.2 → 3 目的:让特征图上的索引变成整数,方便直接切片 副作用:引入 量化误差(0.5 px 级),对小目标/边缘精
阅读全文
摘要:池化(pooling)就是“把一个小邻域内的若干值压缩成一个值”的统计/聚合操作。 在 RoI Align 里,对应步骤是: 把 RoI 平均分成 7×7(或 14×14)个子区域(bin)。 每个 bin 内再取 4 个采样点(浮点坐标)→ 用双线性插值得到 4 个特征值。 池化:对这 4 个值做
阅读全文
摘要:目的:把一个任意大小的候选框(RoI)变成固定 7×7(或 14×14)特征。 做法: 把 RoI 均分成 7×7 个 bin(格子)。 每个 bin 内再选 4 个(或更多)亚像素坐标(浮点坐标),用双线性插值从特征图上计算这 4 点的值并平均,得到该 bin 的最终特征。 这些亚像素坐标就叫“采
阅读全文
摘要:按时间顺序拆成 4 大段、12 个小步,并指出每一步用到的关键模块 / 公式 / 损失。 输入与数据准备① 图像预处理 Resize + Pad 到固定短边 600 px(可配置) 减 ImageNet 均值/方差 水平翻转、随机裁剪做数据增强 标注:每张图给出 N 个真值框 (x₁,y₁,x₂,y
阅读全文
摘要:softmax(或快速归一化)是连接"自学习权重"与"加权组合"的关键桥梁。 完整的处理流程与softmax的作用位置 复制 输入特征图 (P3, P4, P5...) ↓ 1. 自学习原始权重 (w₁, w₂, w₃...) ↓ 2. 【Softmax/快速归一化】 → 归一化权重 (α₁, α₂
阅读全文
摘要:BiFPN是模型架构中的独立模块(Neck),而softmax是BiFPN内部用于权重归一化的计算单元。在实际实现中,通常使用快速归一化方法替代softmax以提升效率,但其功能和位置不变——始终处于BiFPN模块的权重处理环节。 1. BiFPN的位置:Neck部分 BiFPN(Bidirecti
阅读全文
摘要:原文链接:https://blog.csdn.net/di0808/article/details/101887620 int sum = 0; for (int i = 0; i < this.GridView1.Rows.Count; i++) { GridViewRow row=this.Gr
阅读全文
摘要:发布公告:https://devblogs.microsoft.com/dotnet/announcing-dotnet-10/下载地址:https://dotnet.microsoft.com/zh-cn/download/dotnet/10.0/性能改进:https://devblogs.mic
阅读全文
摘要:原文链接:https://zhuanlan.zhihu.com/p/579702765 下采样和上采样 缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个: 1、使得图像符合显示区域的大小; 2、生成对应图像的缩略图。 放大图像(或称为上采样(upsa
阅读全文
摘要:将提示路径中冲突的项目文件都删掉,再重新更新就好了
阅读全文
摘要:第一次遇见这种,项目文件,整个解决方案也没查到.mine文件。 最后将关系到的项目中bin文件夹与obj文件夹的冲突文件删掉后,重新获取就好了。
阅读全文
摘要:原文链接:https://jingyan.baidu.com/article/380abd0a1a9e631d90192cc4.html 很多时候,我们的IE浏览器为了能够更好的保护大家的电脑,默认情况下会有一些安全传输的协定;比方说我们提到的安全警告:是否只查看安全传送的网页内容,这一提示。就是为
阅读全文
摘要:链接:https://www.jsongj.com/img/transparent
阅读全文
摘要:当双击MSI文件时提示解压,通常是由于Windows Installer未正常运行或文件关联设置错误。可以通过手动安装或检查服务状态来解决此问题。 解决步骤 检查Windows Installer服务: 按下 Windows + R 键,输入 services.msc 并回车,打开服务管理界面。 找
阅读全文
摘要:原文链接:https://www.cnblogs.com/zzx-blogs/p/18404430 以管理员身份打开CMD: 按 Win + X → 选择 "Windows PowerShell (管理员)" 或 "命令提示符(管理员)" 执行安装命令: bash 复制 msiexec /i "C:
阅读全文
摘要:将网站停掉后替换,然后再开启,等一会就好了
阅读全文
浙公网安备 33010602011771号