随笔分类 -  研究生

摘要:在深度学习中,模型压缩技术对于提高模型的部署效率和运行速度至关重要。以下是几种常见的模型压缩技术:知识蒸馏、模型剪枝和量化。 1. 知识蒸馏(Knowledge Distillation) 知识蒸馏是一种将大型教师模型的知识迁移到小型学生模型的技术。其核心思想是通过教师模型的输出指导学生模型的训练, 阅读全文
posted @ 2025-04-26 10:00 yinghualeihenmei 阅读(86) 评论(0) 推荐(0)
摘要:模型泛化性:定义、重要性与提升方法 1. 定义 模型泛化性(Generalization)是指机器学习模型在未见过的新数据上表现良好的能力。换句话说,一个具有良好泛化能力的模型不仅在训练数据上表现良好,而且在新的、未见过的数据上也能保持较高的性能。泛化能力是评估模型是否真正“学习”了数据中的规律,而 阅读全文
posted @ 2025-04-26 09:54 yinghualeihenmei 阅读(281) 评论(0) 推荐(1)
摘要:一、资源覆盖与文献类型 知网(CNKI) 最全面:覆盖期刊、博硕论文、会议论文、报纸、年鉴、专利、标准等,文献总量超3亿篇。 独家资源:独家收录80%以上核心期刊,尤其是社科领域(如《中国社会科学》)和科技领域的高影响力期刊。 万方数据 科技信息权威:与国家科技部合作,收录大量科技成果、专利和科技报 阅读全文
posted @ 2025-04-21 13:24 yinghualeihenmei 阅读(586) 评论(0) 推荐(0)
摘要:使用工具(如 PyMuPDF、PDFMiner 等)从 PDF 文件中提取图像内容。如 PyMuPDF使用将pdf转化为图片。 使用 PyMuPDF 将 PDF 转换为图片主要有两种方法:一种是直接提取 PDF 中嵌入的图片,另一种是将 PDF 的每一页渲染为图片。以下是两种方法的详细步骤和代码示例 阅读全文
posted @ 2025-04-20 20:17 yinghualeihenmei 阅读(426) 评论(0) 推荐(0)
摘要:Pascal VOC 数据集格式是目标检测任务中常用的一种数据组织方式。它不仅包含图像文件,还包含与之对应的标注文件(通常是 XML 格式),用于描述图像中目标的位置和类别。以下是 Pascal VOC 数据集格式的详细说明: 数据集结构 Pascal VOC 数据集通常具有以下目录结构: 复制 / 阅读全文
posted @ 2025-04-20 20:06 yinghualeihenmei 阅读(230) 评论(0) 推荐(0)
摘要:需要按照特定的目录结构进行整理,并创建相应的索引文件。以下是详细的步骤: 1. 目录结构 Pascal VOC 数据集的目录结构通常如下: /VOCdevkit /VOC2007 /Annotations 000001.xml 000002.xml ... /JPEGImages 000001.jp 阅读全文
posted @ 2025-04-20 19:03 yinghualeihenmei 阅读(39) 评论(0) 推荐(0)
摘要:GPU 是显卡的核心部件: 显卡是包含 GPU 的硬件设备,GPU 是显卡的核心部件。显卡通过 GPU 来处理图形计算任务,并将结果输出到显示器。 没有 GPU,显卡就无法完成图形处理任务;而 GPU 通常需要显卡的其他组件(如显存、散热系统等)来正常工作。 显卡(Graphics Card): 定 阅读全文
posted @ 2025-04-20 18:03 yinghualeihenmei 阅读(108) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/JulyLi2019/article/details/110850627 阅读全文
posted @ 2025-04-11 00:55 yinghualeihenmei 阅读(8) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/Lamber130/article/details/136262966 (一)简介基于Faster-RCNN的人脸口罩检测系统是在pytorch框架下实现的,这是一个完整的项目,包括代码,数据集,训练好的模型权重,模型训练记录,ui界面等。ui界 阅读全文
posted @ 2025-04-11 00:46 yinghualeihenmei 阅读(19) 评论(0) 推荐(0)
摘要:pip install sip 是一个用于安装 Python 包的命令,但 sip 这个包可能并不是你想要安装的。sip 是一个用于将 C++ 库绑定到 Python 的工具,通常用于开发 PyQt 或 PySide 等 GUI 应用程序。如果你确实需要安装 sip,可以按照以下步骤操作。但如果你的 阅读全文
posted @ 2025-04-11 00:39 yinghualeihenmei 阅读(40) 评论(0) 推荐(0)
摘要:主要是softmax分类器。 分别工作在区域建议网络中,在 Faster R - CNN 的区域建议网络(RPN)里,Softmax 分类器主要用于判定每个锚点(anchor)对应区域是前景(包含目标物体)还是背景,为后续的目标检测任务提供高质量的候选区域。 池化后,也用softmax分类器。 以下 阅读全文
posted @ 2025-04-05 17:04 yinghualeihenmei 阅读(20) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/hellozhxy/article/details/133918264 Swin-Transformer是2021年微软研究院发表在ICCV上的一篇文章,并且已经获得ICCV 2021 best paper的荣誉称号。虽然Vision Trans 阅读全文
posted @ 2025-04-05 16:27 yinghualeihenmei 阅读(224) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/hutao1030813002/article/details/109503752 阅读全文
posted @ 2025-04-03 00:10 yinghualeihenmei 阅读(43) 评论(0) 推荐(0)
摘要:图像滤波是图像处理中的一种基本操作,用于对图像进行平滑、锐化、去噪等处理。滤波操作通常通过卷积核(也称为滤波器或掩模)与图像进行卷积运算来实现。根据滤波器的性质,图像滤波可以分为线性滤波和非线性滤波。 1. 线性滤波 线性滤波是通过线性卷积运算对图像进行处理。常见的线性滤波器包括: 1.1 均值滤波 阅读全文
posted @ 2025-04-02 23:51 yinghualeihenmei 阅读(19) 评论(0) 推荐(0)
摘要:OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库,广泛应用于图像处理、视频分析、目标检测、人脸识别、机器学习等领域。它提供了大量的图像和视频处理功能,支持多种编程语言,包括 C++、Python 和 Java。 以下是 Op 阅读全文
posted @ 2025-04-02 23:30 yinghualeihenmei 阅读(41) 评论(0) 推荐(0)
摘要:RPN(Region Proposal Network)网络是目标检测算法 Faster R - CNN 中的关键组件,它的提出有效解决了传统目标检测方法中区域建议生成速度慢的问题。下面为你详细介绍:结构:共享卷积层:通常使用预训练的卷积神经网络(如 VGG、ResNet 等)对输入图像进行特征提取 阅读全文
posted @ 2025-03-22 21:37 yinghualeihenmei 阅读(215) 评论(0) 推荐(0)
摘要:Feature Map(特征映射)是卷积神经网络(CNN)中一个重要的概念,它指的是在卷积神经网络中,通过卷积操作从输入图像中提取的特征图。 Feature Map描述了输入数据中不同位置的不同特征是否被激活。不同的卷积核都可以学习并提取不同的特征,例如边缘、纹理、颜色等。 而且,一个卷积层通常包含 阅读全文
posted @ 2025-03-22 21:07 yinghualeihenmei 阅读(92) 评论(0) 推荐(0)
摘要:验证集不直接用于调整模型参数,但它对模型参数的调整有间接作用。 验证集主要用于在模型训练过程中评估模型性能,帮助确定最佳超参数。例如,通过观察验证集上的损失值、准确率等指标,判断模型是否过拟合或欠拟合,进而调整超参数,如学习率、正则化系数、网络结构等。超参数的调整会影响模型训练过程中参数更新的方式和 阅读全文
posted @ 2025-03-22 20:46 yinghualeihenmei 阅读(80) 评论(0) 推荐(0)
摘要:梯度消失(Vanishing Gradient)和梯度爆炸(Exploding Gradient)是深度学习中训练神经网络时可能遇到的两个主要问题,它们都与网络中梯度(即损失函数关于网络参数的导数)的行为有关。 梯度(Gradient)是多变量函数在某一点处的变化率,它是一个向量,指向函数增长最快的 阅读全文
posted @ 2025-03-22 20:45 yinghualeihenmei 阅读(130) 评论(0) 推荐(0)
摘要:利用 Mixup、Mosaic 和 Getrandom 对数据集进行扩增 在机器学习和深度学习中,数据扩增(Data Augmentation)是一种常用的技术,用于增加训练数据的多样性,从而提高模型的泛化能力。以下是如何利用 Mixup、Mosaic 和 Getrandom 三种方式对数据集进行扩 阅读全文
posted @ 2025-03-19 18:46 yinghualeihenmei 阅读(332) 评论(0) 推荐(0)