深度学习---2D视觉领域分类

深度学习在2D视觉领域分类

一、图像分类

图像分类是指将数字图像自动分类到不同的预先定义类别中。

二、目标检测

目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同,它不仅需要确定物体的类别,还需要找出物体在图像中的位置。

按照框分类又可以分为平行框检测和旋转框检测

  • 平行框

  • 旋转框

平行框和旋转框对比

三、图像分割

图像分割是指将数字图像中的像素划分为不同的区域或对象的过程。

  • 语义分割

    对图片中每个像素分配一个语义标签(类别)

  • 实例分割

    实例分割可以理解成目标检测和语义分割的结合,其检测出每个对象的位置,并用分割掩膜(mask)表示每个对象所在区域,同一类别中的不同物体表示为不同的实例

  • 全景分割

    可以理解成语义分割和实例分割的结合,即每个像素都分配一个语义标签和一个实例ID,语义标签和实例ID都相同的像素认为是属于同一个对象。

四、测验

posted @ 2023-05-15 22:16  半夜打老虎  阅读(167)  评论(1)    收藏  举报