研究生 - 随笔分类(第2页) - yinghualeihenmei

可以在faster r cnn 中引入 Swin Transformer 作为骨干网络吗

摘要：在 Faster R-CNN 中引入 Swin Transformer 作为骨干网络是完全可行的，并且已经在多个项目和研究中得到了实现。Swin Transformer 提供了强大的特征提取能力，能够显著提升目标检测的性能。以下是将 Swin Transformer 集成到 Faster R-CNN 阅读全文

posted @ 2025-04-26 10:46 yinghualeihenmei 阅读(55) 评论(0) 推荐(0)

基于Faster R-CNN的多尺度特征建模

摘要：基于 Faster R-CNN 的多尺度特征建模是一种用于提升目标检测性能的技术，特别是在处理不同尺度目标时。多尺度特征建模可以帮助模型更好地捕捉从大到小的各种目标，从而提高检测精度和鲁棒性。以下是关于基于 Faster R-CNN 的多尺度特征建模的详细内容，包括其原理、实现方法和优势。1. 为什阅读全文

posted @ 2025-04-26 10:34 yinghualeihenmei 阅读(153) 评论(0) 推荐(0)

贝塞尔曲线

摘要：贝塞尔曲线（Bézier Curve）是一种广泛应用于计算机图形学、动画设计、字体设计和CAD（计算机辅助设计）等领域的参数化曲线。它通过一组控制点来定义曲线的形状，具有简单、灵活、易于控制的特点。贝塞尔曲线建模是指利用贝塞尔曲线的数学性质来构建和编辑曲线、曲面或动画路径的过程。1. 贝塞尔曲线的数阅读全文

posted @ 2025-04-26 10:16 yinghualeihenmei 阅读(351) 评论(0) 推荐(0)

测精度不足（F 度量 < 70%）

摘要：Measurement accuracy is insufficient：表示测量或检测的精度不够，无法满足预期的要求。F-measure < 70%：F-measure（F1分数）：是分类任务中常用的性能指标，综合考虑了精确率（Precision）和召回率（Recall）。精确率（Precisio 阅读全文

posted @ 2025-04-26 10:13 yinghualeihenmei 阅读(35) 评论(0) 推荐(0)

边缘计算硬件

摘要：“边缘计算硬件” 翻译为英文是 Edge Computing Hardware。解释Edge Computing（边缘计算）：指在靠近数据源或用户的地方进行数据处理和分析，而不是将所有数据传输到云端或数据中心。这种方式可以减少延迟，提高实时性，适用于物联网（IoT）、自动驾驶、工业自动化等场景。Ha 阅读全文

posted @ 2025-04-26 10:07 yinghualeihenmei 阅读(66) 评论(0) 推荐(0)

几种常见的模型压缩技术

摘要：在深度学习中，模型压缩技术对于提高模型的部署效率和运行速度至关重要。以下是几种常见的模型压缩技术：知识蒸馏、模型剪枝和量化。 1. 知识蒸馏（Knowledge Distillation）知识蒸馏是一种将大型教师模型的知识迁移到小型学生模型的技术。其核心思想是通过教师模型的输出指导学生模型的训练，阅读全文

posted @ 2025-04-26 10:00 yinghualeihenmei 阅读(118) 评论(0) 推荐(0)

模型泛化性

摘要：模型泛化性：定义、重要性与提升方法 1. 定义模型泛化性（Generalization）是指机器学习模型在未见过的新数据上表现良好的能力。换句话说，一个具有良好泛化能力的模型不仅在训练数据上表现良好，而且在新的、未见过的数据上也能保持较高的性能。泛化能力是评估模型是否真正“学习”了数据中的规律，而阅读全文

posted @ 2025-04-26 09:54 yinghualeihenmei 阅读(412) 评论(0) 推荐(1)

万方、维普、知网的区别

摘要：一、资源覆盖与文献类型知网（CNKI）最全面：覆盖期刊、博硕论文、会议论文、报纸、年鉴、专利、标准等，文献总量超3亿篇。独家资源：独家收录80%以上核心期刊，尤其是社科领域（如《中国社会科学》）和科技领域的高影响力期刊。万方数据科技信息权威：与国家科技部合作，收录大量科技成果、专利和科技报阅读全文

posted @ 2025-04-21 13:24 yinghualeihenmei 阅读(1127) 评论(0) 推荐(0)

python将 PDF 转换为图片

摘要：使用工具（如 PyMuPDF、PDFMiner 等）从 PDF 文件中提取图像内容。如 PyMuPDF使用将pdf转化为图片。使用 PyMuPDF 将 PDF 转换为图片主要有两种方法：一种是直接提取 PDF 中嵌入的图片，另一种是将 PDF 的每一页渲染为图片。以下是两种方法的详细步骤和代码示例阅读全文

posted @ 2025-04-20 20:17 yinghualeihenmei 阅读(595) 评论(0) 推荐(0)

Pascal VOC 数据集格式

摘要：Pascal VOC 数据集格式是目标检测任务中常用的一种数据组织方式。它不仅包含图像文件，还包含与之对应的标注文件（通常是 XML 格式），用于描述图像中目标的位置和类别。以下是 Pascal VOC 数据集格式的详细说明：数据集结构 Pascal VOC 数据集通常具有以下目录结构：复制 / 阅读全文

posted @ 2025-04-20 20:06 yinghualeihenmei 阅读(323) 评论(0) 推荐(0)

怎么将标注好的图片和对应的 XML 文件组织成 Pascal VOC 数据集格式

摘要：需要按照特定的目录结构进行整理，并创建相应的索引文件。以下是详细的步骤： 1. 目录结构 Pascal VOC 数据集的目录结构通常如下： /VOCdevkit /VOC2007 /Annotations 000001.xml 000002.xml ... /JPEGImages 000001.jp 阅读全文

posted @ 2025-04-20 19:03 yinghualeihenmei 阅读(52) 评论(0) 推荐(0)

GPU与显卡的关系

摘要：GPU 是显卡的核心部件：显卡是包含 GPU 的硬件设备，GPU 是显卡的核心部件。显卡通过 GPU 来处理图形计算任务，并将结果输出到显示器。没有 GPU，显卡就无法完成图形处理任务；而 GPU 通常需要显卡的其他组件（如显存、散热系统等）来正常工作。显卡（Graphics Card）：定阅读全文

posted @ 2025-04-20 18:03 yinghualeihenmei 阅读(465) 评论(0) 推荐(0)

MaskRCNN可视化界面开发(PyQt5)

摘要：原文链接：https://blog.csdn.net/JulyLi2019/article/details/110850627 阅读全文

posted @ 2025-04-11 00:55 yinghualeihenmei 阅读(11) 评论(0) 推荐(0)

基于Faster-RCNN的人脸口罩检测系统，可进行图像目标检测，也可进行视屏检测（pytorch框架，python）

摘要：原文链接：https://blog.csdn.net/Lamber130/article/details/136262966 （一）简介基于Faster-RCNN的人脸口罩检测系统是在pytorch框架下实现的，这是一个完整的项目，包括代码，数据集，训练好的模型权重，模型训练记录，ui界面等。ui界阅读全文

posted @ 2025-04-11 00:46 yinghualeihenmei 阅读(25) 评论(0) 推荐(0)

pip install sip

摘要：pip install sip 是一个用于安装 Python 包的命令，但 sip 这个包可能并不是你想要安装的。sip 是一个用于将 C++ 库绑定到 Python 的工具，通常用于开发 PyQt 或 PySide 等 GUI 应用程序。如果你确实需要安装 sip，可以按照以下步骤操作。但如果你的阅读全文

posted @ 2025-04-11 00:39 yinghualeihenmei 阅读(52) 评论(0) 推荐(0)

fater r cnn 中的分类器,与工作位置

摘要：主要是softmax分类器。分别工作在区域建议网络中，在 Faster R - CNN 的区域建议网络（RPN）里，Softmax 分类器主要用于判定每个锚点（anchor）对应区域是前景（包含目标物体）还是背景，为后续的目标检测任务提供高质量的候选区域。池化后，也用softmax分类器。以下阅读全文

posted @ 2025-04-05 17:04 yinghualeihenmei 阅读(34) 评论(0) 推荐(0)

Swin-Transformer详解

摘要：原文链接：https://blog.csdn.net/hellozhxy/article/details/133918264 Swin-Transformer是2021年微软研究院发表在ICCV上的一篇文章，并且已经获得ICCV 2021 best paper的荣誉称号。虽然Vision Trans 阅读全文

posted @ 2025-04-05 16:27 yinghualeihenmei 阅读(299) 评论(0) 推荐(0)

pytorch搭建PyQt5界面实战：ResNet-18实现CLFAR-10图像分类，并进行界面显示

摘要：原文链接：https://blog.csdn.net/hutao1030813002/article/details/109503752 阅读全文

posted @ 2025-04-03 00:10 yinghualeihenmei 阅读(46) 评论(0) 推荐(0)

Faster R-CNN 与图像滤波

摘要：图像滤波是图像处理中的一种基本操作，用于对图像进行平滑、锐化、去噪等处理。滤波操作通常通过卷积核（也称为滤波器或掩模）与图像进行卷积运算来实现。根据滤波器的性质，图像滤波可以分为线性滤波和非线性滤波。 1. 线性滤波线性滤波是通过线性卷积运算对图像进行处理。常见的线性滤波器包括： 1.1 均值滤波阅读全文

posted @ 2025-04-02 23:51 yinghualeihenmei 阅读(28) 评论(0) 推荐(0)

OpenCV

摘要：OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，广泛应用于图像处理、视频分析、目标检测、人脸识别、机器学习等领域。它提供了大量的图像和视频处理功能，支持多种编程语言，包括 C++、Python 和 Java。以下是 Op 阅读全文

posted @ 2025-04-02 23:30 yinghualeihenmei 阅读(80) 评论(0) 推荐(0)

随笔分类 - 研究生

公告