2025 年 12月随笔档案 - yinghualeihenmei

CRNN

摘要：CRNN（Convolutional Recurrent Neural Network）是一种用于图像序列识别的端到端可训练神经网络，特别擅长处理场景文本识别任务。CRNN 的核心架构包括三个主要部分：卷积层（CNN）、循环层（RNN）和转录层（Transcription Layer），结合 CT 阅读全文

posted @ 2025-12-06 22:00 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

MD-FPN

摘要：MD-FPN 是一种优化的特征金字塔网络结构，旨在提高多尺度目标检测的性能。它通过引入多尺度预测融合和注意力机制，增强了特征提取能力 MD-FPN（Multi-Dilation Feature Pyramid Network）可以与 Faster R-CNN 结合使用，以提升模型对多尺度目标的检测能阅读全文

posted @ 2025-12-06 21:55 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

Focal Loss

摘要：Focal Loss 是一种用于解决类别不平衡问题的损失函数，特别适用于目标检测任务。在目标检测中，背景类别通常远多于目标类别，这导致模型在训练过程中对背景类别过度拟合，而忽视了目标类别。Focal Loss 通过调整损失函数的权重，使得模型更关注难以分类的样本，从而提高模型对目标类别的检测能力。阅读全文

posted @ 2025-12-06 21:36 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

FPS的实时处理能力

摘要：21.3 FPS（Frames Per Second）的实时处理能力”是指一个系统或模型能够在每秒处理大约21.3帧图像或视频数据。这个指标通常用于衡量计算机视觉模型（如目标检测、分割等）在实时应用中的性能。 21.3 FPS 的意义实时性： 21.3 FPS 表示系统能够在大约每秒处理21.3帧阅读全文

posted @ 2025-12-06 21:25 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

收敛至约0.28

摘要：“收敛至约0.28”这个表述通常出现在描述模型训练过程中的某个指标（如损失函数值或准确率等）逐渐稳定并接近某个特定值（这里是0.28）的情况。具体含义取决于上下文，以下是一些可能的解释和应用场景： 1. 损失函数收敛至约0.28 在训练深度学习模型时，损失函数（Loss Function）是衡量模型阅读全文

posted @ 2025-12-06 21:01 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

冻结预训练层策略为什么冻结

摘要：在深度学习中，冻结预训练层策略（Freezing Pre-trained Layers）是一种常见的技术，尤其是在使用预训练模型进行迁移学习（Transfer Learning）时。这种策略的核心思想是将预训练模型的一部分层（通常是早期层）冻结，即在训练过程中不更新这些层的权重，而只训练模型的其他部阅读全文

posted @ 2025-12-06 20:55 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

学习率衰减策略

摘要：学习率衰减策略（Learning Rate Decay）是深度学习中一种重要的技术，用于在训练过程中动态调整学习率。这种策略可以帮助模型在训练初期快速收敛，并在训练后期更精细地调整权重，从而提高模型的性能和泛化能力。学习率衰减策略（Learning Rate Decay）的核心功能就是自动降低学习阅读全文

posted @ 2025-12-06 20:34 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

权重衰减

摘要：在深度学习中，权重衰减（Weight Decay）是一种常用的正则化技术，用于防止模型过拟合。它通过在损失函数中添加一个正则化项来限制模型的复杂度，从而提高模型的泛化能力。权重衰减（Weight Decay）通常在整个训练过程中都使用，而不是仅在某个特定阶段。在 Faster R-CNN 的训练阅读全文

posted @ 2025-12-06 20:28 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

faster r cnn中的动量

摘要：在动量优化算法中，动量参数（通常用 β 表示）用于控制上一次梯度更新对当前更新的影响程度。动量参数的值在 0 到 1 之间，0.9 是一个常见的选择，它可以帮助优化算法更快地收敛，并且减少震荡。动量（Momentum）通常在整个训练过程中都使用，而不是仅在某个特定阶段。在 Faster R-C 阅读全文

posted @ 2025-12-06 20:23 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

轮数选择

摘要：训练轮数（Epochs） = 完整遍历整个训练集的次数，是控制模型学习深度的核心超参数。一、定义与计算 1个Epoch = 所有训练样本都参与一次梯度更新 Python 复制 # 示例：8000张图纸，batch_size=4 num_images = 8000 batch_size = 4 # 阅读全文

posted @ 2025-12-06 19:58 yinghualeihenmei 阅读(1) 评论(0) 推荐(0)

Batch Size

摘要：深度学习的"批量大小" Batch Size = 每次梯度更新时使用的训练样本数量。梯度更新 = 参数更新，两者是同一过程的不同表述。梯度更新发生在反向传播（Backward Pass）之后、优化器调用step()的瞬间。作用于 Faster R-CNN 的所有可训练参数，而非某个特定模块内部阅读全文

posted @ 2025-12-06 19:54 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

初始学习率 0.002

摘要：初始学习率 0.002 是 Faster R-CNN 精细微调场景下的保守配置，比标准值 0.02 小10倍，适用于迁移学习冻结Backbone或Warmup预热阶段。一、0.002 的使用场景场景1：分层学习率中的Backbone Python 复制 # Backbone微调慢，Head训练快阅读全文

posted @ 2025-12-06 19:31 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

Anchor宽高比

摘要：Anchor宽高比是Anchor的形状参数，与尺寸(Scale)共同决定每个候选框的具体高宽像素值。通用场景（COCO） yaml 复制 # 3种比例覆盖大部分目标 ASPECT_RATIOS: [0.5, 1.0, 2.0] # 0.5: 高大于宽 (人、柱子) # 1.0: 正方形 (车辆、盘阅读全文

posted @ 2025-12-06 17:42 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

Anchor尺寸

摘要：Anchor尺寸 {16, 32, 64, 128} 是建筑图纸检测的极致精简配置，专为小目标密集+资源受限场景设计。一、核心参数解码 Python 复制 # 对应FPN的4个层级 P3(stride=8): scale=16 → 实际尺寸 128×128px # 符号、标记 P4(stride= 阅读全文

posted @ 2025-12-06 17:40 yinghualeihenmei 阅读(1) 评论(0) 推荐(0)

SGD优化器贯穿Faster R-CNN的全模型

摘要：统一管理所有可训练参数的更新，而非作用于某个局部模块。一、全局视角：SGD管理哪些参数？ Python 复制 # Faster R-CNN可训练参数总览 model = FasterRCNN( backbone=ResNet50(), # 包含 conv1~conv5_x, BN层 rpn=RPN 阅读全文

posted @ 2025-12-06 17:35 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

尺度变换是指图片大小变化吗

摘要：是的，但远不止改变图片大小这么简单。一、尺度变换 = 改变图像分辨率最直接的定义：将图像从原始尺寸（如 3000×2000）缩放到另一尺寸（如 800×600 或 4000×3000）。阅读全文

posted @ 2025-12-06 13:50 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

COCO数据集评估标准中计算 mAP（mean Average Precision）的核心方法：

摘要：在 IoU阈值从0.5到0.95 的范围内，每隔 0.05 计算一个AP，然后取平均值。 mAP@[.5:.95]=101IoU=0.5∑0.95APIoU 具体IoU阈值序列： [0.5,0.55,0.6,0.65,0.7,0.75,0.8,0.85,0.9,0.95] 共 10个阈值点，阅读全文

posted @ 2025-12-06 13:46 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

噪声图中的“噪声”

摘要：“与真实信号无关、可量化、可预测的随机扰动强度分布”；它既可以是统计标准差，也可以是模型残差，或物理采集误差，最终被画成一张“强度图”供算法使用。阅读全文

posted @ 2025-12-06 02:37 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

数据集

摘要：1. CubiCasa5K 规模：5 000 张真实楼盘平面图标注：SVG 多边形，80+ 类别（墙、门、窗、家具等）；官方划分 train/val/test = 4200/400/400 特点：目前最大、最丰富的栅格平面图片集；分辨率 430×485 ~ 6316×14304 px；支持多任务（阅读全文

posted @ 2025-12-06 02:33 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

CubiCasa5K 的原始数据集和代码仓库地址如下：

摘要：GitHub 官方仓库（含数据集下载链接）https://github.com/CubiCasa/CubiCasa5k在该页面中可直接下载 5 000 张平面图及其 SVG 标注，并附有 PyTorch 多任务训练代码与 Docker 环境说明。 Kaggle 镜像（需注册）https://www 阅读全文

posted @ 2025-12-06 02:25 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

标注结果YOLO 格式的文件

摘要：YOLO 格式（Ultralytics 版）一行代表一个对象，共 5 列或更多： <class_id> <x_center> <y_center> <width> <height> 所有数值都是归一化的浮点数（0–1）：坐标 = 像素值 ÷ 图像宽高框用中心点 + 宽高表示类别编号从阅读全文

posted @ 2025-12-06 00:46 yinghualeihenmei 阅读(6) 评论(0) 推荐(0)

ECA 注意力机制在rol poling 的哪里

摘要：ECA 注意力机制并不内嵌在 RoI Pooling 运算内部，而是套在 RoI Pooling 之前或之后的卷积特征图上，常见位置有两处： Backbone 侧（RoI Pooling 之前）在 Faster R-CNN 的 VGG/ResNet backbone 里，每个卷积块或 conv4_x 阅读全文

posted @ 2025-12-06 00:36 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

量化操作

摘要：“把连续或大数值映射成离散或小数值” 的过程，在深度网络里主要有两条主线：特征量化（常见于检测/分割的 RoI 系列）把浮点坐标四舍五入到整像素例：x=6.7 → 6，y=3.2 → 3 目的：让特征图上的索引变成整数，方便直接切片副作用：引入量化误差（0.5 px 级），对小目标/边缘精阅读全文

posted @ 2025-12-06 00:18 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

对每个子区域的采样点进行池化操作，池化操作是什么

摘要：池化（pooling）就是“把一个小邻域内的若干值压缩成一个值”的统计/聚合操作。在 RoI Align 里，对应步骤是：把 RoI 平均分成 7×7（或 14×14）个子区域（bin）。每个 bin 内再取 4 个采样点（浮点坐标）→ 用双线性插值得到 4 个特征值。池化：对这 4 个值做阅读全文

posted @ 2025-12-06 00:15 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

RoI Align / RoI Pool 里的采样点

摘要：目的：把一个任意大小的候选框（RoI）变成固定 7×7（或 14×14）特征。做法：把 RoI 均分成 7×7 个 bin（格子）。每个 bin 内再选 4 个（或更多）亚像素坐标（浮点坐标），用双线性插值从特征图上计算这 4 点的值并平均，得到该 bin 的最终特征。这些亚像素坐标就叫“采阅读全文

posted @ 2025-12-06 00:13 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

faster r cnn 用到所有技术和流程

摘要：按时间顺序拆成 4 大段、12 个小步，并指出每一步用到的关键模块 / 公式 / 损失。输入与数据准备① 图像预处理 Resize + Pad 到固定短边 600 px（可配置）减 ImageNet 均值/方差水平翻转、随机裁剪做数据增强标注：每张图给出 N 个真值框 (x₁,y₁,x₂,y 阅读全文

posted @ 2025-12-05 23:13 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

模块会根据自学习到的权重对各输入进行加权组合，再经过卷积、BN和激活函数等进一步处理，形成新的融合特征图，是BiFPN内部的核心机制

摘要：softmax（或快速归一化）是连接"自学习权重"与"加权组合"的关键桥梁。完整的处理流程与softmax的作用位置复制输入特征图 (P3, P4, P5...) ↓ 1. 自学习原始权重 (w₁, w₂, w₃...) ↓ 2. 【Softmax/快速归一化】 → 归一化权重 (α₁, α₂ 阅读全文

posted @ 2025-12-05 18:32 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

BiFPN和softmax在目标检测模型中的相对位置关系

摘要：BiFPN是模型架构中的独立模块（Neck），而softmax是BiFPN内部用于权重归一化的计算单元。在实际实现中，通常使用快速归一化方法替代softmax以提升效率，但其功能和位置不变——始终处于BiFPN模块的权重处理环节。 1. BiFPN的位置：Neck部分 BiFPN（Bidirecti 阅读全文

posted @ 2025-12-05 18:29 yinghualeihenmei 阅读(2) 评论(0) 推荐(0)

取得Gridview的指定某一列的值

摘要：原文链接：https://blog.csdn.net/di0808/article/details/101887620 int sum = 0; for (int i = 0; i < this.GridView1.Rows.Count; i++) { GridViewRow row=this.Gr 阅读全文

posted @ 2025-12-05 18:13 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

关于.NET 10性能与 AI 是主题色

摘要：发布公告：https://devblogs.microsoft.com/dotnet/announcing-dotnet-10/下载地址：https://dotnet.microsoft.com/zh-cn/download/dotnet/10.0/性能改进：https://devblogs.mic 阅读全文

posted @ 2025-12-05 18:01 yinghualeihenmei 阅读(7) 评论(0) 推荐(0)

上采样(UnSampling) 和下采样(DownSampling)是啥

摘要：原文链接：https://zhuanlan.zhihu.com/p/579702765 下采样和上采样缩小图像（或称为下采样（subsampled）或降采样（downsampled））的主要目的有两个： 1、使得图像符合显示区域的大小； 2、生成对应图像的缩略图。放大图像（或称为上采样（upsa 阅读全文

posted @ 2025-12-05 09:14 yinghualeihenmei 阅读(7) 评论(0) 推荐(0)

提交文件的冲突，提示找不到项目文件

摘要：将提示路径中冲突的项目文件都删掉，再重新更新就好了阅读全文

posted @ 2025-12-04 18:22 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

安装路径中 <<<<<<.mine 无效，路径中有非法字符

摘要：第一次遇见这种，项目文件，整个解决方案也没查到.mine文件。最后将关系到的项目中bin文件夹与obj文件夹的冲突文件删掉后，重新获取就好了。阅读全文

posted @ 2025-12-03 12:05 yinghualeihenmei 阅读(3) 评论(0) 推荐(0)

安全警告:是否只查看安全传送的网页内容解决

摘要：原文链接：https://jingyan.baidu.com/article/380abd0a1a9e631d90192cc4.html 很多时候，我们的IE浏览器为了能够更好的保护大家的电脑，默认情况下会有一些安全传输的协定；比方说我们提到的安全警告:是否只查看安全传送的网页内容，这一提示。就是为阅读全文

posted @ 2025-12-03 09:59 yinghualeihenmei 阅读(8) 评论(0) 推荐(0)

图片白色背景变成透明色

摘要：链接：https://www.jsongj.com/img/transparent 阅读全文

posted @ 2025-12-02 09:36 yinghualeihenmei 阅读(5) 评论(0) 推荐(0)

为什么.msi文件双击提示解压

摘要：当双击MSI文件时提示解压，通常是由于Windows Installer未正常运行或文件关联设置错误。可以通过手动安装或检查服务状态来解决此问题。解决步骤检查Windows Installer服务: 按下 Windows + R 键，输入 services.msc 并回车，打开服务管理界面。找阅读全文

posted @ 2025-12-02 09:35 yinghualeihenmei 阅读(19) 评论(0) 推荐(0)

不会安装该公布应用程序，因为它可能不安全。请于管理员联系将程序包的安装用户界面选项更改为基本

摘要：原文链接：https://www.cnblogs.com/zzx-blogs/p/18404430 以管理员身份打开CMD：按 Win + X → 选择 "Windows PowerShell (管理员)" 或 "命令提示符(管理员)" 执行安装命令： bash 复制 msiexec /i "C: 阅读全文

posted @ 2025-12-01 16:04 yinghualeihenmei 阅读(9) 评论(0) 推荐(0)

部署网站，一替换dll,网站就报错

摘要：将网站停掉后替换，然后再开启，等一会就好了阅读全文

posted @ 2025-12-01 14:53 yinghualeihenmei 阅读(4) 评论(0) 推荐(0)

12 2025 档案

公告