随笔分类 -  研究生

摘要:在 Faster R-CNN 中引入 Swin Transformer 作为骨干网络是完全可行的,并且已经在多个项目和研究中得到了实现。Swin Transformer 提供了强大的特征提取能力,能够显著提升目标检测的性能。以下是将 Swin Transformer 集成到 Faster R-CNN 阅读全文
posted @ 2025-04-26 10:46 yinghualeihenmei 阅读(54) 评论(0) 推荐(0)
摘要:基于 Faster R-CNN 的多尺度特征建模是一种用于提升目标检测性能的技术,特别是在处理不同尺度目标时。多尺度特征建模可以帮助模型更好地捕捉从大到小的各种目标,从而提高检测精度和鲁棒性。以下是关于基于 Faster R-CNN 的多尺度特征建模的详细内容,包括其原理、实现方法和优势。1. 为什 阅读全文
posted @ 2025-04-26 10:34 yinghualeihenmei 阅读(148) 评论(0) 推荐(0)
摘要:贝塞尔曲线(Bézier Curve)是一种广泛应用于计算机图形学、动画设计、字体设计和CAD(计算机辅助设计)等领域的参数化曲线。它通过一组控制点来定义曲线的形状,具有简单、灵活、易于控制的特点。贝塞尔曲线建模是指利用贝塞尔曲线的数学性质来构建和编辑曲线、曲面或动画路径的过程。1. 贝塞尔曲线的数 阅读全文
posted @ 2025-04-26 10:16 yinghualeihenmei 阅读(335) 评论(0) 推荐(0)
摘要:Measurement accuracy is insufficient:表示测量或检测的精度不够,无法满足预期的要求。F-measure < 70%:F-measure(F1分数):是分类任务中常用的性能指标,综合考虑了精确率(Precision)和召回率(Recall)。精确率(Precisio 阅读全文
posted @ 2025-04-26 10:13 yinghualeihenmei 阅读(34) 评论(0) 推荐(0)
摘要:“边缘计算硬件” 翻译为英文是 Edge Computing Hardware。解释Edge Computing(边缘计算):指在靠近数据源或用户的地方进行数据处理和分析,而不是将所有数据传输到云端或数据中心。这种方式可以减少延迟,提高实时性,适用于物联网(IoT)、自动驾驶、工业自动化等场景。Ha 阅读全文
posted @ 2025-04-26 10:07 yinghualeihenmei 阅读(61) 评论(0) 推荐(0)
摘要:在深度学习中,模型压缩技术对于提高模型的部署效率和运行速度至关重要。以下是几种常见的模型压缩技术:知识蒸馏、模型剪枝和量化。 1. 知识蒸馏(Knowledge Distillation) 知识蒸馏是一种将大型教师模型的知识迁移到小型学生模型的技术。其核心思想是通过教师模型的输出指导学生模型的训练, 阅读全文
posted @ 2025-04-26 10:00 yinghualeihenmei 阅读(113) 评论(0) 推荐(0)
摘要:模型泛化性:定义、重要性与提升方法 1. 定义 模型泛化性(Generalization)是指机器学习模型在未见过的新数据上表现良好的能力。换句话说,一个具有良好泛化能力的模型不仅在训练数据上表现良好,而且在新的、未见过的数据上也能保持较高的性能。泛化能力是评估模型是否真正“学习”了数据中的规律,而 阅读全文
posted @ 2025-04-26 09:54 yinghualeihenmei 阅读(398) 评论(0) 推荐(1)
摘要:一、资源覆盖与文献类型 知网(CNKI) 最全面:覆盖期刊、博硕论文、会议论文、报纸、年鉴、专利、标准等,文献总量超3亿篇。 独家资源:独家收录80%以上核心期刊,尤其是社科领域(如《中国社会科学》)和科技领域的高影响力期刊。 万方数据 科技信息权威:与国家科技部合作,收录大量科技成果、专利和科技报 阅读全文
posted @ 2025-04-21 13:24 yinghualeihenmei 阅读(1087) 评论(0) 推荐(0)
摘要:使用工具(如 PyMuPDF、PDFMiner 等)从 PDF 文件中提取图像内容。如 PyMuPDF使用将pdf转化为图片。 使用 PyMuPDF 将 PDF 转换为图片主要有两种方法:一种是直接提取 PDF 中嵌入的图片,另一种是将 PDF 的每一页渲染为图片。以下是两种方法的详细步骤和代码示例 阅读全文
posted @ 2025-04-20 20:17 yinghualeihenmei 阅读(583) 评论(0) 推荐(0)
摘要:Pascal VOC 数据集格式是目标检测任务中常用的一种数据组织方式。它不仅包含图像文件,还包含与之对应的标注文件(通常是 XML 格式),用于描述图像中目标的位置和类别。以下是 Pascal VOC 数据集格式的详细说明: 数据集结构 Pascal VOC 数据集通常具有以下目录结构: 复制 / 阅读全文
posted @ 2025-04-20 20:06 yinghualeihenmei 阅读(311) 评论(0) 推荐(0)
摘要:需要按照特定的目录结构进行整理,并创建相应的索引文件。以下是详细的步骤: 1. 目录结构 Pascal VOC 数据集的目录结构通常如下: /VOCdevkit /VOC2007 /Annotations 000001.xml 000002.xml ... /JPEGImages 000001.jp 阅读全文
posted @ 2025-04-20 19:03 yinghualeihenmei 阅读(52) 评论(0) 推荐(0)
摘要:GPU 是显卡的核心部件: 显卡是包含 GPU 的硬件设备,GPU 是显卡的核心部件。显卡通过 GPU 来处理图形计算任务,并将结果输出到显示器。 没有 GPU,显卡就无法完成图形处理任务;而 GPU 通常需要显卡的其他组件(如显存、散热系统等)来正常工作。 显卡(Graphics Card): 定 阅读全文
posted @ 2025-04-20 18:03 yinghualeihenmei 阅读(432) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/JulyLi2019/article/details/110850627 阅读全文
posted @ 2025-04-11 00:55 yinghualeihenmei 阅读(11) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/Lamber130/article/details/136262966 (一)简介基于Faster-RCNN的人脸口罩检测系统是在pytorch框架下实现的,这是一个完整的项目,包括代码,数据集,训练好的模型权重,模型训练记录,ui界面等。ui界 阅读全文
posted @ 2025-04-11 00:46 yinghualeihenmei 阅读(24) 评论(0) 推荐(0)
摘要:pip install sip 是一个用于安装 Python 包的命令,但 sip 这个包可能并不是你想要安装的。sip 是一个用于将 C++ 库绑定到 Python 的工具,通常用于开发 PyQt 或 PySide 等 GUI 应用程序。如果你确实需要安装 sip,可以按照以下步骤操作。但如果你的 阅读全文
posted @ 2025-04-11 00:39 yinghualeihenmei 阅读(50) 评论(0) 推荐(0)
摘要:主要是softmax分类器。 分别工作在区域建议网络中,在 Faster R - CNN 的区域建议网络(RPN)里,Softmax 分类器主要用于判定每个锚点(anchor)对应区域是前景(包含目标物体)还是背景,为后续的目标检测任务提供高质量的候选区域。 池化后,也用softmax分类器。 以下 阅读全文
posted @ 2025-04-05 17:04 yinghualeihenmei 阅读(33) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/hellozhxy/article/details/133918264 Swin-Transformer是2021年微软研究院发表在ICCV上的一篇文章,并且已经获得ICCV 2021 best paper的荣誉称号。虽然Vision Trans 阅读全文
posted @ 2025-04-05 16:27 yinghualeihenmei 阅读(286) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/hutao1030813002/article/details/109503752 阅读全文
posted @ 2025-04-03 00:10 yinghualeihenmei 阅读(46) 评论(0) 推荐(0)
摘要:图像滤波是图像处理中的一种基本操作,用于对图像进行平滑、锐化、去噪等处理。滤波操作通常通过卷积核(也称为滤波器或掩模)与图像进行卷积运算来实现。根据滤波器的性质,图像滤波可以分为线性滤波和非线性滤波。 1. 线性滤波 线性滤波是通过线性卷积运算对图像进行处理。常见的线性滤波器包括: 1.1 均值滤波 阅读全文
posted @ 2025-04-02 23:51 yinghualeihenmei 阅读(25) 评论(0) 推荐(0)
摘要:OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库,广泛应用于图像处理、视频分析、目标检测、人脸识别、机器学习等领域。它提供了大量的图像和视频处理功能,支持多种编程语言,包括 C++、Python 和 Java。 以下是 Op 阅读全文
posted @ 2025-04-02 23:30 yinghualeihenmei 阅读(76) 评论(0) 推荐(0)