学习了哪些知识,计算机视觉才算入门?

作者:Jinming Su
链接:https://www.zhihu.com/question/26836846/answer/163865798
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

关注这个问题很久了,简单说一下自己的见解.

1. 道

计算机视觉分很多方向,个人比较熟悉的是图像方面的,包括:图像分类、目标检测、图像分割、视频处理等,这些小的方面每一个也学要很长的一段时间去学习.

入门这个东西很难定义,如果只是对一个方向看一下,了解一点东西,有一点谈资的话不算入门,我认为入门至少代表你对这个领域的某些东西进行过处理实践才可以,所以我比较喜欢的一种学习新知识的方式就是:先找一个综述的书随便翻一翻,对目录有个印象就行,然后针对自己喜欢的部分,去查资料,做实例,看论文,一段时间后,自然就会有自己的理解了.

---------- 半年后更新

2. 术

需要哪些数学 编程 工具 等知识?

数学知识的话,大概基础的就是概率论、数理统计、矩阵论

编程基础的是python、matlab

工具上,现在一般是用框架,我常用caffe,还有一些其他常用的框架tensorflow、pytorch、mxnet等

 

入门的话,本科的数学知识基本就够了,然后开始看论文吧。基本现在搞计算机视觉(Computer Vision, CV)都是基于深度学习的。第一篇推荐alexnet,算是深度学习搞CV的开山之作,接着基本就是需要先把分类的看一看,现在的CV大多数任务都是基于分类任务的深度网络进行扩展的。

列一些个人感觉必看的论文(只写出名字,链接自己去找吧):

AlexNet

ZFNet

VGGNet

GoogLeNet

ResNet

SeNet

DenseNet

 

上述论文每一篇都精读,看一篇论文之后跑一下作者提供的source code,大概就对使用深度学习搞计算机视觉了解个大概了。

之后就是根据自己的兴趣,detection、tracking、semantic segmentation、visual Q&A、image captioning等,自己去找相应的论文去看吧。

入手一个新的领域,先找那些著名的论文,精度10篇,基本就入门了。

posted @ 2021-07-27 22:42  redufa  阅读(131)  评论(0)    收藏  举报