计算机视觉-前言

计算机视觉


图像识别中首先应该看到哪些信息?

答:1. 三维场景的结构信息。比如让机器人可以在街道上正常的在道路上邢进而不会去撞击建筑物。2. 理解寓意概念。能够分辨出场景中的例如垃圾桶、人、车等都是些什么东西。

 

1. 什么是图像分类任务,它有哪些应用场合?


图像分类任务是计算机视觉中的核心人物,其目标是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。

 

 

2. 图像分类任务有哪些难点


 

3. 基于规则的方法是否可行?


通过硬编码的方式识别猫或者其他类,是一件很困难的事情。因为猫的形变很大,所以这种方式不适合形变很大的物体。

4. 什么是数据驱动的图像分类范式?


数据驱动的方法时最流行的方法。

第一步,数据集构建。第二步,分类器设计与学习。第三步,分类器决策。

 

分类器设计与学习:首先输入图像X,然后对图像进行表示,将图像表示传入分类模型中,无论分类模型的好坏都会有一个预测值,将预测值与真实值进行比较会用到损失函数,从而产生损失值, 然后利用损失值通过优化函数来更新模型的参数。

 

图像表示的主要方法:1. 像素表示,就是通过三通道RGB来表示。2. 全局特征表示,从整图像中抽取特征,比如GIST特征(频率特征),这种方法比较适合风景类、室内场景以及城市建筑等大场景的分类。全局特征就是在计算的过程中要依赖所有的像素。3. 在考虑遮挡情况影响的时候,我们更多的是考虑使用局部特征。比如SIFT特征+词袋模型。

以上现在主要是用的依旧还是像素表示,因为深度学习神经网络的出现。

分类器:近邻分类器、贝叶斯分类器、线性分类器、支撑向量分类器、神经网络分类器、随机森林、Adaboost。

损失函数:0-1损失、多类支撑向量机损失、交叉熵损失、L1损失、L2损失。

优化方法:一阶方法:梯度下降、随机梯度下降、小批量随机梯度下降。二阶方法:牛顿法、BDGS、L-BFGS。

训练过程:数据集划分;数据预处理;数据增强;欠拟合与过拟合:减小算法复杂度、使用权重正则项、使用dropout正则化;超参数调整;模型集成。

5. 常用的分类任务评价指标是什么?


正确率、错误率。

 

posted @ 2021-11-21 10:59  用余生去爱  阅读(127)  评论(0)    收藏  举报