随笔分类 -  深度学习

摘要:PointNet++ 地址:http://stanford.edu/~rqi/pointnet2/ 1.两者主要不同点 考虑到PointNet特征提取时只考虑单点,不能很好的表示局部结构 ==> PointNet++引入了sampling & grouping,考虑局部领域特征 PointNet中g 阅读全文
posted @ 2023-12-14 10:12 半夜打老虎 阅读(4217) 评论(0) 推荐(1)
摘要:常见的3D数据表示方式有点云、多视图、体素、mesh网格等。 PointNet是直接处理点云数据的网络,可以实现对点云的分类和分割,其首页地址为:http://stanford.edu/~rqi/pointnet/。 主要从解决点云的无序性和保证旋转一致性两个方向出发,提出了以点云作为输入的分类网络 阅读全文
posted @ 2023-12-07 14:13 半夜打老虎 阅读(638) 评论(0) 推荐(0)
摘要:前面介绍了单目标关键点检测网络 Stacked Hourglass Networks,如下图所示,一次只能检测出一个目标的关键点信息,但实际情况下一个场景出现多个目标的概率更大,所以原作者在Stacked Hourglass Networks的基础上提出了Associative Embedding, 阅读全文
posted @ 2023-11-30 17:04 半夜打老虎 阅读(261) 评论(0) 推荐(0)
摘要:Stacked Hourglass Networks是2016年提出的一种用于单人人体姿态估计的网络,并取得了很好的效果。这里我们从网络结构以及一些实现细节简单分析下这个网络。 paper: https://arxiv.org/pdf/1603.06937.pdf code: https://git 阅读全文
posted @ 2023-11-17 15:26 半夜打老虎 阅读(336) 评论(0) 推荐(0)
摘要:前面介绍了分类、目标检测、分割以及一些常见模型和实现,这一篇接着介绍关键点检测的相关深度学习方法。已经有一些文章记录了关键点在不同领域的应用,比如:人脸关键点检测综述 和 人体骨骼关键点检测综述,其比较详细介绍了人脸检测和骨骼点检测方面的一些论文,其他还有手势识别、服饰关键点检测等应用,这些大都是按 阅读全文
posted @ 2023-11-10 13:32 半夜打老虎 阅读(3030) 评论(0) 推荐(0)
摘要:yolact是第一个在COCO 数据集上做到实时的实例分割模型(大于30FPS),其将问题划分成两个平行的分支,一个分支由特征金字塔的P3层,经过Protonet预测mask,另一个分支通过P3-P7特征层预测类别、包围框以及mask的系数coefficient。另外还提出了比NMS更快的方法Fas 阅读全文
posted @ 2023-10-27 16:55 半夜打老虎 阅读(339) 评论(0) 推荐(0)
摘要:2D物体分割 在https://www.cnblogs.com/xiaxuexiaoab/p/17403325.html中提到过,2D物体分割大体可以分为语义分割、实例分割和全景分割,这里对其基本概念进行介绍,并参照一篇综述,按照分割采用的方法不同分为十类。 一、基本概念 语义分割、实例分割和全景分 阅读全文
posted @ 2023-10-20 11:05 半夜打老虎 阅读(348) 评论(0) 推荐(0)
摘要:一、网络介绍 YoloX由旷视科技开源,以YoloV3(Darknet53作为backbone)作为基线,最大的区别在于 Decoupled Head,Data Aug,Anchor Free 和样本匹配(SimOTA)这几个方面,另外还提供了完善的代码,并很贴心的提供了部署脚本,真的很友好了。 P 阅读全文
posted @ 2023-10-08 11:02 半夜打老虎 阅读(497) 评论(0) 推荐(0)
摘要:前面介绍了图像分类网络,并重点解析了ResNet及其应用以及MobileNet系列的轻量化分类网络,这一篇接着介绍图像目标检测网络。 目标检测具有巨大的实用价值和应用前景。 应用领域包括人脸检测、行人检测、车辆检测、飞机航拍或卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等 阅读全文
posted @ 2023-09-15 15:16 半夜打老虎 阅读(451) 评论(0) 推荐(0)
摘要:前面介绍了MobileNetV1和MobileNetV2,这次介绍这个系列最后一篇MobileNetV3,它沿用了V1的深度可分离卷积以及v2的倒残差网络和瓶颈层,再其基础上做了一系列优化,保证精度最大化的同时减少网络延时。主要改进点包含以下几步: 引入NetAdapt算法自动获取扩展层和瓶颈层的通 阅读全文
posted @ 2023-09-08 10:52 半夜打老虎 阅读(629) 评论(0) 推荐(0)
摘要:前面利用ResNet18实现了二分类,这里借助分类网络来识别图片和视频中不同肤色的人数。大体流程可以分为以下几步:数据获取、数据处理、模型训练、图片识别以及视频识别,其中大部分内容参考《机器视觉之TensorFlow2入门、原理与应用实践》第4章。 一、数据获取 这里获取黑人和白人模特数据用于训练。 阅读全文
posted @ 2023-08-15 10:52 半夜打老虎 阅读(174) 评论(0) 推荐(0)
摘要:前一篇实现了OpenCV推理ResNet18, 这一篇采用腾讯的NCNN框架实现ResNet18推理。 一、准备 1、 NCNN编译及安装 同OpenCV推理一样,首先需要准备NCNN,NCNN源码编译及安装可参考: https://www.cnblogs.com/xiaxuexiaoab/p/16 阅读全文
posted @ 2023-07-26 16:28 半夜打老虎 阅读(398) 评论(0) 推荐(0)
摘要:前一篇实现了ResNet18训练自定义数据集,详细介绍了数据集制作、模型构建及训练,并且介绍了相应模块如何可视化。前面训练阶段是在python环境下进行的,但实际工程部署的时候大都采用C++实现推理,这一篇我们借助OpenCV实现ResNet18推理。 一、准备 1、OpenCV编译及安装 借助Op 阅读全文
posted @ 2023-07-21 16:40 半夜打老虎 阅读(348) 评论(0) 推荐(0)
摘要:前面一篇内容讲解了如何利用Pytorch实现ResNet,这一篇我们用ResNet18实现一个二分类。接下来从模型、数据及训练三个方面展开。 一、目标 利用ResNet18将以下数据分为两类 class_0 class_1 二、模型 ResNet系列的模型在上一篇已经详细介绍了,这里采用ResNet 阅读全文
posted @ 2023-07-13 21:10 半夜打老虎 阅读(1627) 评论(0) 推荐(0)
摘要:一、为什么引入ResNet 通过上一篇分类网络的介绍,我们知道网络的宽度和深度可以很好的提高网络的性能,深的网络一般都比浅的的网络效果好,但训练一个很深的网络是非常困难的,一方面是网络越深越容易出现梯度消失和梯度爆炸问题, 然而这个问题通过BN层和ReLU激活函数等方法在很大程度上已经得到解决;另一 阅读全文
posted @ 2023-05-25 20:22 半夜打老虎 阅读(679) 评论(0) 推荐(0)
摘要:深度学习在2D视觉领域分类 一、图像分类 图像分类是指将数字图像自动分类到不同的预先定义类别中。 二、目标检测 目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同,它不仅需要确定物体的类别,还需要找出物体在图像中的位置。 按照框分类又可以分为平行框检测和旋转框检测。 平行框 旋转 阅读全文
posted @ 2023-05-15 22:16 半夜打老虎 阅读(167) 评论(1) 推荐(0)
摘要:分类网络 深度学习在图像邻域的应用大致可以分为图像分类、目标检测、图像分割三大类,其中图像分割又可以细分为语义分割、实例分割和全景分割,这一篇梳理下常见的分类数据集和分类网络,后续会重点介绍ResNet,并逐步实现ResNet训练及推理。 一、常用分类数据集 MNIST 内容是0-9的手写数字,60 阅读全文
posted @ 2023-05-08 22:30 半夜打老虎 阅读(2191) 评论(0) 推荐(0)
摘要:本文对接触到的深度学习相关内容做一个梳理。 一、深度学习 1. 深度学习是什么 深度学习(Deep Learning)是机器学习(Machine Learning)的一个研究方向,而机器学习属于人工智能(AI, Artificial Intelligence)的范畴,人工智能是研究、开发用于模拟、延 阅读全文
posted @ 2023-04-19 22:48 半夜打老虎 阅读(389) 评论(0) 推荐(0)
摘要:一、ncnn模型 可由ncnn库中的onnx2ncnn工具将onnx格式模型转换为ncnn格式的.param和.bin两个文件,其中param记录了各算子,param文件可直接由可视化工具Nerton打开查看,这里记录下param文件格式。ncnn模型的加载参考:ncnn加载模型的几种方式 二、pa 阅读全文
posted @ 2023-03-28 22:28 半夜打老虎 阅读(987) 评论(0) 推荐(0)
摘要:在目标检测时通常需要计算包围框的IOU,用于判断正负样本以及后续NMS过滤。框A和框B的IOU的值为其交集面积除以并集面积, $$IOU = \frac{Area_{A \cap B}}{Area_{A \cup B}}$$ 如果框为轴向包围盒,则可以参考IOU及NMS实现 ,但有时会遇到旋转框问题 阅读全文
posted @ 2023-01-15 16:03 半夜打老虎 阅读(2092) 评论(0) 推荐(0)