深度学习 - 随笔分类(第3页) - 半夜打老虎

深度学习3D网络---PointNet++

摘要：PointNet++ 地址：http://stanford.edu/~rqi/pointnet2/ 1.两者主要不同点考虑到PointNet特征提取时只考虑单点，不能很好的表示局部结构 ==> PointNet++引入了sampling & grouping，考虑局部领域特征 PointNet中g 阅读全文

posted @ 2023-12-14 10:12 半夜打老虎阅读(4217) 评论(0) 推荐(1)

深度学习3D网络---PointNet

摘要：常见的3D数据表示方式有点云、多视图、体素、mesh网格等。 PointNet是直接处理点云数据的网络，可以实现对点云的分类和分割，其首页地址为：http://stanford.edu/~rqi/pointnet/。主要从解决点云的无序性和保证旋转一致性两个方向出发，提出了以点云作为输入的分类网络阅读全文

posted @ 2023-12-07 14:13 半夜打老虎阅读(638) 评论(0) 推荐(0)

多目标关键点检测Associative Embedding

摘要：前面介绍了单目标关键点检测网络 Stacked Hourglass Networks，如下图所示，一次只能检测出一个目标的关键点信息，但实际情况下一个场景出现多个目标的概率更大，所以原作者在Stacked Hourglass Networks的基础上提出了Associative Embedding，阅读全文

posted @ 2023-11-30 17:04 半夜打老虎阅读(261) 评论(0) 推荐(0)

深度学习---单目标关键点检测网络Stacked Hourglass

摘要：Stacked Hourglass Networks是2016年提出的一种用于单人人体姿态估计的网络，并取得了很好的效果。这里我们从网络结构以及一些实现细节简单分析下这个网络。 paper: https://arxiv.org/pdf/1603.06937.pdf code: https://git 阅读全文

posted @ 2023-11-17 15:26 半夜打老虎阅读(336) 评论(0) 推荐(0)

深度学习---关键点检测

摘要：前面介绍了分类、目标检测、分割以及一些常见模型和实现，这一篇接着介绍关键点检测的相关深度学习方法。已经有一些文章记录了关键点在不同领域的应用，比如：人脸关键点检测综述和人体骨骼关键点检测综述，其比较详细介绍了人脸检测和骨骼点检测方面的一些论文，其他还有手势识别、服饰关键点检测等应用，这些大都是按阅读全文

posted @ 2023-11-10 13:32 半夜打老虎阅读(3030) 评论(0) 推荐(0)

深度学习---实例分割网络yolact

摘要：yolact是第一个在COCO 数据集上做到实时的实例分割模型（大于30FPS），其将问题划分成两个平行的分支，一个分支由特征金字塔的P3层，经过Protonet预测mask，另一个分支通过P3-P7特征层预测类别、包围框以及mask的系数coefficient。另外还提出了比NMS更快的方法Fas 阅读全文

posted @ 2023-10-27 16:55 半夜打老虎阅读(339) 评论(0) 推荐(0)

深度学习---图像分割

摘要：2D物体分割在https://www.cnblogs.com/xiaxuexiaoab/p/17403325.html中提到过，2D物体分割大体可以分为语义分割、实例分割和全景分割，这里对其基本概念进行介绍，并参照一篇综述，按照分割采用的方法不同分为十类。一、基本概念语义分割、实例分割和全景分阅读全文

posted @ 2023-10-20 11:05 半夜打老虎阅读(348) 评论(0) 推荐(0)

深度学习---目标检测网络YoloX

摘要：一、网络介绍 YoloX由旷视科技开源，以YoloV3(Darknet53作为backbone)作为基线，最大的区别在于 Decoupled Head，Data Aug，Anchor Free 和样本匹配（SimOTA）这几个方面，另外还提供了完善的代码，并很贴心的提供了部署脚本，真的很友好了。 P 阅读全文

posted @ 2023-10-08 11:02 半夜打老虎阅读(497) 评论(0) 推荐(0)

深度学习---图像目标检测网络

摘要：前面介绍了图像分类网络，并重点解析了ResNet及其应用以及MobileNet系列的轻量化分类网络，这一篇接着介绍图像目标检测网络。目标检测具有巨大的实用价值和应用前景。应用领域包括人脸检测、行人检测、车辆检测、飞机航拍或卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等阅读全文

posted @ 2023-09-15 15:16 半夜打老虎阅读(451) 评论(0) 推荐(0)

MobileNetV3

摘要：前面介绍了MobileNetV1和MobileNetV2，这次介绍这个系列最后一篇MobileNetV3，它沿用了V1的深度可分离卷积以及v2的倒残差网络和瓶颈层，再其基础上做了一系列优化，保证精度最大化的同时减少网络延时。主要改进点包含以下几步：引入NetAdapt算法自动获取扩展层和瓶颈层的通阅读全文

posted @ 2023-09-08 10:52 半夜打老虎阅读(629) 评论(0) 推荐(0)

识别图片和视频中不同肤色的人数

摘要：前面利用ResNet18实现了二分类，这里借助分类网络来识别图片和视频中不同肤色的人数。大体流程可以分为以下几步：数据获取、数据处理、模型训练、图片识别以及视频识别，其中大部分内容参考《机器视觉之TensorFlow2入门、原理与应用实践》第4章。一、数据获取这里获取黑人和白人模特数据用于训练。阅读全文

posted @ 2023-08-15 10:52 半夜打老虎阅读(174) 评论(0) 推荐(0)

NCNN推理ResNet18

摘要：前一篇实现了OpenCV推理ResNet18, 这一篇采用腾讯的NCNN框架实现ResNet18推理。一、准备 1、 NCNN编译及安装同OpenCV推理一样，首先需要准备NCNN，NCNN源码编译及安装可参考： https://www.cnblogs.com/xiaxuexiaoab/p/16 阅读全文

posted @ 2023-07-26 16:28 半夜打老虎阅读(398) 评论(0) 推荐(0)

OpenCV实现ResNet18推理

摘要：前一篇实现了ResNet18训练自定义数据集，详细介绍了数据集制作、模型构建及训练，并且介绍了相应模块如何可视化。前面训练阶段是在python环境下进行的，但实际工程部署的时候大都采用C++实现推理，这一篇我们借助OpenCV实现ResNet18推理。一、准备 1、OpenCV编译及安装借助Op 阅读全文

posted @ 2023-07-21 16:40 半夜打老虎阅读(348) 评论(0) 推荐(0)

Resnet18实现二分类

摘要：前面一篇内容讲解了如何利用Pytorch实现ResNet，这一篇我们用ResNet18实现一个二分类。接下来从模型、数据及训练三个方面展开。一、目标利用ResNet18将以下数据分为两类 class_0 class_1 二、模型 ResNet系列的模型在上一篇已经详细介绍了，这里采用ResNet 阅读全文

posted @ 2023-07-13 21:10 半夜打老虎阅读(1627) 评论(0) 推荐(0)

深度学习分类网络---ResNet

摘要：一、为什么引入ResNet 通过上一篇分类网络的介绍，我们知道网络的宽度和深度可以很好的提高网络的性能，深的网络一般都比浅的的网络效果好，但训练一个很深的网络是非常困难的，一方面是网络越深越容易出现梯度消失和梯度爆炸问题，然而这个问题通过BN层和ReLU激活函数等方法在很大程度上已经得到解决；另一阅读全文

posted @ 2023-05-25 20:22 半夜打老虎阅读(679) 评论(0) 推荐(0)

深度学习---2D视觉领域分类

摘要：深度学习在2D视觉领域分类一、图像分类图像分类是指将数字图像自动分类到不同的预先定义类别中。二、目标检测目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同，它不仅需要确定物体的类别，还需要找出物体在图像中的位置。按照框分类又可以分为平行框检测和旋转框检测。平行框旋转阅读全文

posted @ 2023-05-15 22:16 半夜打老虎阅读(167) 评论(1) 推荐(0)

深度学习---图像分类网络

摘要：分类网络深度学习在图像邻域的应用大致可以分为图像分类、目标检测、图像分割三大类，其中图像分割又可以细分为语义分割、实例分割和全景分割，这一篇梳理下常见的分类数据集和分类网络，后续会重点介绍ResNet，并逐步实现ResNet训练及推理。一、常用分类数据集 MNIST 内容是0-9的手写数字，60 阅读全文

posted @ 2023-05-08 22:30 半夜打老虎阅读(2191) 评论(0) 推荐(0)

深度学习--- 深度学习基础

摘要：本文对接触到的深度学习相关内容做一个梳理。一、深度学习 1. 深度学习是什么深度学习（Deep Learning）是机器学习（Machine Learning）的一个研究方向，而机器学习属于人工智能（AI， Artificial Intelligence）的范畴，人工智能是研究、开发用于模拟、延阅读全文

posted @ 2023-04-19 22:48 半夜打老虎阅读(389) 评论(0) 推荐(0)

ncnn param文件格式

摘要：一、ncnn模型可由ncnn库中的onnx2ncnn工具将onnx格式模型转换为ncnn格式的.param和.bin两个文件，其中param记录了各算子，param文件可直接由可视化工具Nerton打开查看，这里记录下param文件格式。ncnn模型的加载参考:ncnn加载模型的几种方式二、pa 阅读全文

posted @ 2023-03-28 22:28 半夜打老虎阅读(987) 评论(0) 推荐(0)

斜框IOU实现

摘要：在目标检测时通常需要计算包围框的IOU，用于判断正负样本以及后续NMS过滤。框A和框B的IOU的值为其交集面积除以并集面积， $$IOU = \frac{Area_{A \cap B}}{Area_{A \cup B}}$$ 如果框为轴向包围盒，则可以参考IOU及NMS实现，但有时会遇到旋转框问题阅读全文

posted @ 2023-01-15 16:03 半夜打老虎阅读(2092) 评论(0) 推荐(0)

半夜打老虎

随笔分类 - 深度学习

公告