片刻的自由 - 博客园

2024年12月17日

[ACM MM2024]CLIPCleaner Cleaning Noisy Labels with CLIP

摘要：这篇文章基于样本选择的噪声标签学习（Learning with Noisy labels）方法，通过引入CLIP帮助过滤噪声样本。 Introduction 噪声标签的方法包括：开发鲁棒的损失函数使用标签噪声转移矩阵对噪声标签进行建模然而这些方法在处理高噪声比和复杂的噪声模式（两个图片很相近但阅读全文

posted @ 2024-12-17 11:42 片刻的自由阅读(184) 评论(0) 推荐(0)

2024年12月7日

对比学习simclr，对比inforNCE与NCE loss（附pytorch代码）

摘要： SimCLR Chen, Ting, et al. "A simple framework for contrastive learning of visual representations." International conference on machine learning. PMLR, 阅读全文

posted @ 2024-12-07 16:56 片刻的自由阅读(966) 评论(0) 推荐(0)

2024年11月26日

[ECCV2024]GLAD Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection

摘要：在工业异常检测任务中，引入并改进扩散模型，通过重建比较实现异常检测。 Background 异常检测（anomaly detection，AD）旨在检测和定位工业产品物体的异常模式，然而：在某些情况下，为所有异常类型收集足够的异常样本具有挑战性。由于产品设计和生产流程不断变化，不可能提前收集所有阅读全文

posted @ 2024-11-26 11:27 片刻的自由阅读(281) 评论(0) 推荐(0)

2024年11月20日

使用预训练的YOLOv11模型进行屏幕检测

摘要：介绍利用PyQt5搭建一个透明、置顶的画布，根据提供的信息绘制结果。信息包括：边框坐标、检测类别名称、置信度。屏幕的信息通过mss库实时截屏获取，通过cv2库处理后输入模型进行处理，得到结果。这里的YOLO v11模型的checkpoints由ultralytics提供，首次使用会自动下载.p 阅读全文

posted @ 2024-11-20 17:32 片刻的自由阅读(922) 评论(0) 推荐(1)

2024年11月15日

YOLO v1 v2 v3 技术细节

摘要：相对于R-CNN、Fast RCNN的two-stage目标检测方式，即先在图像中提取候选框，再逐一对图像进行分类。候选框的生成可以是滑动窗口或选择性搜索，再对候选框进行非极大值抑制（一般只在推理时做非极大值抑制，训练时需要这些重复的框）。而YOLO则是one-stage的端到端形式：输入图片，经过阅读全文

posted @ 2024-11-15 10:29 片刻的自由阅读(98) 评论(0) 推荐(0)

2024年11月5日

[AAAI2024]AnomalyGPT Detecting Industrial Anomalies Using Large Vision-Language Models

摘要：本篇论文将大语言模型应用在工业异常检测（Industrial Anomaly Detection，IAD）任务。引言 IAD任务旨在检测和定位工业产品图像中的异常。由于现实世界样本的稀有性和不可预测性，要求模型仅在正常样本上进行训练，并实现对测试时异常样本的检测。如图1，现有的IAD方法给出异常阅读全文

posted @ 2024-11-05 14:36 片刻的自由阅读(614) 评论(0) 推荐(0)

2024年10月24日

噪声标签学习方式之一：噪声转移矩阵估计

摘要：基本原理样本的干净标签后验概率\(P(\mathbf{Y}|X=\mathbf{x})\)，可通过噪声标签的后验概率\(P(\bar{\mathbf{Y}}|X = \mathbf{x})\)和噪声转移矩阵\(T(\mathbf{x})\)得到，即： \[P(\bar{\mathbf{Y}}|X= 阅读全文

posted @ 2024-10-24 16:25 片刻的自由阅读(287) 评论(0) 推荐(0)

2024年10月13日

在wsl上配置vscode和c++环境

摘要：在wsl中配置Ubuntu 在power shell中输出指令，更新并检查版本 wsl --update wsl --version # WSL 版本： 2.3.24.0 # 内核版本： 5.15.153.1-2 # WSLg 版本： 1.0.65 # MSRDC 版本： 1.2.5620 # Di 阅读全文

posted @ 2024-10-13 12:13 片刻的自由阅读(777) 评论(0) 推荐(1)

2024年10月1日

clothing1m数据集使用

摘要：简介 Clothing1M 包含 14 个类别的 100 万张服装图像。这是一个带有噪声标签的数据集，因为数据是从多个在线购物网站收集的，并且包含许多错误标记的样本。该数据集还分别包含 50k、14k 和 10k 张带有干净标签的图像，用于训练、验证和测试。下载地址：https://github. 阅读全文

posted @ 2024-10-01 16:40 片刻的自由阅读(448) 评论(0) 推荐(0)

2024年9月30日

[CVPR2024]CDMAD Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Learning

摘要：在不平衡半监督学习的设置下，分类器往往会偏向头部类，这种偏置在有标签集合和无标签集合分布不一致的情况下会进一步加剧，也更难生成准确的伪标签。文中提出了一种新的简单的衡量分类器偏好程度的方法：通过分类器对无意义图片的预测结果来度量模型对类别的偏好，同时根据偏好，在伪标签生成阶段和分类测试阶段调整分类器阅读全文

posted @ 2024-09-30 17:07 片刻的自由阅读(210) 评论(0) 推荐(0)

2024年9月28日

使用cifar100上训练的resnet18进行ood测试

摘要：以cifar100作为闭集(closed-set)数据集，使用resnet18模型进行训练，然后在常见的开集(out-of-distribution)数据集上进行OOD检测。使用MSP(Maximum Softmax Probability)作为OOD检测的依据。开集噪声数据集使用gaussian 阅读全文

posted @ 2024-09-28 11:03 片刻的自由阅读(164) 评论(0) 推荐(0)

2024年9月22日

[CVPR2024]DeiT-LT Distillation Strikes Back for Vision Transformer Training on Long-Tailed Datasets

摘要：在长尾数据集上，本文引入强增强（文中也称为OOD）实现对DeiT的知识蒸馏的改进，实现尾部类分类性能的提升。动机 ViT相较于CNN缺少归纳偏置，如局部性（一个像素与周围的区域关系更紧密）、平移不变性（图像的主体在图像的任意位置都应该一样重要）。因此需要大型数据集进行预训练。长尾数据学习的工作有阅读全文

posted @ 2024-09-22 20:48 片刻的自由阅读(342) 评论(0) 推荐(0)

2024年8月9日

[CVPR2022]DASO Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced Semi-Supervised Learning

摘要：问题的背景设置：半监督学习下，labeled data和unlabeled data的分布不同，且存在类别不平衡。文章提出了一种新的伪标签生成方法：DistributionAware Semantics-Oriented (DASO) Pseudo-label。首先生成语义伪标签和线性为标签，然后将阅读全文

posted @ 2024-08-09 20:32 片刻的自由阅读(189) 评论(0) 推荐(0)

2024年8月6日

[WACV2022]Addressing out-of-distribution label noise in webly-labelled data

摘要：该论文考虑了一个现实的场景：数据集来自网络爬虫，即存在开集噪声OOD样本和闭集噪声ID样本。作者提出了一个简单但有效的策略：通过新设计的指标区分OOD样本，并对OOD样本软化（soften）弥补与干净样本的差距，该方法称为：Dynamic Softening of Out-of-distributi 阅读全文

posted @ 2024-08-06 19:48 片刻的自由阅读(123) 评论(0) 推荐(0)

2024年8月3日

数据集WebVision 1.0 (google 子集)介绍附pytorch下的简单使用

摘要： WebVision数据集介绍官方下载地址 WebVision数据集常用于开集/闭集噪声学习、长尾噪声学习方法在真实数据集上的评估。根据[2]的统计，干净样本占70%，OOD噪声占25%，ID噪声占5%。由于数据集本身较大，论文中使用的都是其中很小的一部分，进入下载页面，选择《WebVision 阅读全文

posted @ 2024-08-03 14:45 片刻的自由阅读(391) 评论(0) 推荐(0)