最有影响力的计算机视觉会议及期刊论文

1 最有影响力的30篇计算机视觉会议论文

选取论文的原则：

（1）会议论文，主要来源于以下会议：CVPR, ICCV, ECCV, BMVC, FG, ICIP, ICPR, WACV, ICASSP, MM, IJCAI, UAI, AAAI…（其实后面的几个会议都是打酱油的，AI类的期刊也木有高引CV文章，事实也是如此，没有收录ICML和NIPS等，见谅）

（2）发表在2000年以后，数据来源于微软学术搜索(http://academic.research.microsoft.com/)，2012年12月初的检索结果

（3）检索次数大于200，PER>50，微软学术搜索的被检索次数未必精确，但能反应大概趋势，PER指意味着每年检索量，自发表次年算到2012年，PER=Cited/(2012-YEAR)

榜单Top 30如下，欢迎拾遗补缺：

[1] Rapid Object Detection using a Boosted Cascade of Simple Features (Citations: 3296, PER=299.64)

Paul A. Viola, Michael J. Jones @CVPR , vol. 1, pp. 511-518, 2001

[2] Histograms of Oriented Gradients for Human Detection (Citations: 1704, PER=243.43)

Navneet Dalal, Bill Triggs @CVPR , vol. 1, pp. 886-893, 2005

[3] SURF: Speeded-Up Robust Features (Citations: 1054, PER=175.67)

Herbert Bay, Tinne Tuytelaars, Luc J. Van Gool @ECCV , pp. 404-417, 2006

[4] Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories (Citations: 873, PER=145.5)

Svetlana Lazebnik, Cordelia Schmid, Jean Ponce @CVPR , vol. 2, pp. 2169-2178, 2006

[5] Object Class Recognition by Unsupervised Scale-Invariant Learning (Citations: 1071, PER=119)

Robert Fergus, Pietro Perona, Andrew Zisserman @CVPR , vol. 2, pp. 264-271, 2003

[6] Robust Real-Time Face Detection (Citations: 1092, PER=99.27)

Paul A. Viola, Michael J. Jones @ ICCV , 2001

[7] A Bayesian hierarchical model for learning natural scene categories (Citations: 677, PER=96.71)

Fei-Fei Li, Pietro Perona @CVPR , vol. 2, pp. 524-531, 2005

[8] Scalable Recognition with a Vocabulary Tree (Citations: 570, PER=95)

David Nistér, Henrik Stewénius @CVPR , vol. 2, pp. 2161-2168, 2006

[9] Real-Time Tracking of Non-Rigid Objects Using Mean Shift (Citations: 1132, PER=94.33)

Dorin Comaniciu, Visvanathan Ramesh, Peter Meer @CVPR , vol. 2, pp. 2142-149 vol.2, 2000

[10]Visual Categorization with Bags of Keypoints (Citations: 745, PER=93.13)

Gabriella Csurka, Christopher R. Dance, Lixin Fan, etc @ECCV , 2004

[11]Video Google: A Text Retrieval Approach to Object Matching in Videos (Citations: 790, PER=87.78)

Josef Sivic, Andrew Zisserman @ ICCV , pp. 1470-1477, 2003

[12]What Energy Functions Can Be Minimized via Graph Cuts? (Citations: 842, PER=84.2)

Vladimir Kolmogorov, Ramin Zabih @ECCV , pp. 65-81, 2002

[13]Overview of the Face Recognition Grand Challenge (Citations: 578, PER=82.57)

P. Jonathon Phillips, Patrick J. Flynn, W. Todd Scruggs, etc @CVPR , vol. 1, pp. 947-954, 2005

[14]Robust wide baseline stereo from maximally stable extremal regions (Citations: 810, PER=81)

Jiri Matas, Ondrej Chum, Martin Urban, etc @BMVC , vol. 1, 2002

[15]PCA-SIFT: A More Distinctive Representation for Local Image Descriptors (Citations: 639, PER=79.88)

Yan Ke, Rahul Sukthankar @CVPR , vol. 2, pp. 506-513, 2004

[16]Interactive Graph Cuts for Optimal Boundary and Region Segmentation of Objects in ND Images (Citations: 796, PER=72.36)

Yuri Y. Boykov, Marie-pierre Jolly @ ICCV , pp. 105-112, 2001

[17]An extended set of Haar-like features for rapid object detection (Citations: 710, PER=71)

Rainer Lienhart, Jochen Maydt @ICIP , vol. 1, pp. 900-903, 2002

[18]A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics(Citations: 750, PER=68.18)

David R. Martin, Charless Fowlkes, Doron Tal, etc @ ICCV , pp. 416-425, 2001

[19]Detecting Pedestrians Using Patterns of Motion and Appearance (Citations: 584, PER=64.89)

Paul A. Viola, Michael J. Jones, Daniel Snow @ ICCV , pp. 734-741, 2003

[20]Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary (Citations: 603, PER=60.3)

Pinar Duygulu, Kobus Barnard, João F. G. De Freitas, etc @ECCV , pp. 97-112, 2002

[21]Real-Time Simultaneous Localisation and Mapping with a Single Camera (Citations: 527, PER=58.56)

Andrew J. Davison @ ICCV , pp. 1403-1410, 2003

[22]Recognizing Human Actions: A Local SVM Approach (Citations: 440, PER=55)

Christian Schüldt, Ivan Laptev, Barbara Caputo @ICPR , pp. 32-36, 2004

[23]Actions as Space-Time Shapes (Citations: 379, PER=54.14)

Moshe Blank, Lena Gorelick, Eli Shechtman, etc @ ICCV , vol. 2, pp. 1395-1402, 2005

[24]A Discriminatively Trained, Multiscale, Deformable Part Model (Citations: 215, PER=53.75)

Pedro F. Felzenszwalb, David A. Mcallester, Deva Ramanan @CVPR , pp. 1-8, 2008

[25]Non-parametric Model for Background Subtraction (Citations: 642, PER=53.5)

Ahmed M. Elgammal, David Harwood, Larry S. Davis @ECCV , pp. 751-767, 2000

[26]A Comparison and Evaluation of Multi-View Stereo Reconstruction Algorithms (Citations: 318, PER=53)

Steven M. Seitz, Brian Curless, James Diebel, etc @CVPR , vol. 1, pp. 519-528, 2006

[27]Comprehensive Database for Facial Expression Analysis (Citations: 636, PER=53)

Takeo Kanade, Yingli Tian, Jeffrey F. Cohn @FG , pp. 46-53, 2000

[28]Learning Realistic Human Actions from Movies (Citations: 211, PER=52.75)

Ivan Laptev, Marcin Marszalek, Cordelia Schmid, etc @CVPR , pp. 1-8, 2008

[29]Object Retrieval with Large Vocabularies and Fast Spatial Matching (Citations: 258, PER=51.6)

James Philbin, Ondrej Chum, Michael Isard, etc @CVPR , 2007

[30]Statistical Shape Influence in Geodesic Active Contours (Citations: 616, PER=51.33)

Michael E. Leventon, W. Eric L. Grimson, Olivier D. Faugeras @CVPR , vol. 1, pp. 1316-1323, 2000

简单小结：

　　总共30篇会议文章，其中CVPR 14篇，ECCV 5篇，ICCV 7篇，BMVC、FG、ICIP、ICPR各1篇。每年发表的论文数如图所示。

　　个人比较关注3个方面，(1)检测Detection（比如基于Harr-like的Viola-Jones的3篇文章，[1][6][19]，还有[17]，基于HOG的[2]，以及在PASCAL VOC上大放光芒的DPM[24]）；(2)基于Bag of Words (Features)和LDA的图像检索Retrieval和类别学习Categorization（比如基于BoW的[10][11]，之后的[8][29]，以及非常流行的SPM[4]，基于LDA的[7]等）；(3)特征Features，比如说提到的Harr-like，SURF[3]，HOG[2]，MSER[14]，PCA-SIFT[15]等。

　　值得注意的是，排在前面的大部分作者，都是CV界的成名人物，非常值得关注他们的其他一些论文。

　　PS：[12]的作者Ramin Zabih从TPAMI的主编位置上退下，[20]的作者David Forsyth成为TPAMI新的掌舵者，大家有什么看法？

最后额外推荐几篇ML的方法，来自于ICML和NIPS。

[1] Reinforcement learning: An introduction (Citations: 5592)

Richard S. Sutton, Andrew G. Barto @NIPS , vol. 9, no. 5, pp. 1054-1054, 1998

[2] Experiments with a New Boosting Algorithm (Citations: 2489)

Yoav Freund, Robert E. Schapire @ICML , pp. 148-156, 1996

[3] Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data (Citations: 2436)

John D. Lafferty, Andrew McCallum, Fernando C. N. Pereira @ICML , pp. 282-289, 2001

[4] Latent Dirichlet Allocation (Citations: 1548)

David M. Blei, Andrew Y. Ng, Michael I. Jordan @NIPS , pp. 601-608, 2001

[5] On Spectral Clustering: Analysis and an algorithm (Citations: 1230)

Andrew Y. Ng, Michael I. Jordan, Yair Weiss @NIPS , pp. 849-856, 2001

[6] Algorithms for Nonnegative Matrix Factorization (Citations: 1162)

Daniel D. Lee, H. Sebastian Seung @NIPS , vol. 13, pp. 556-562, 2000

[7] Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions (Citations: 665)

Xiaojin Zhu, Zoubin Ghahramani, John D. Lafferty @ICML , pp. 912-919, 2003

2 最有影响力的20篇计算机视觉期刊论文

选取论文的原则：

（1）期刊论文，主要来源于以下期刊：TPAMI，IJCV，TIP，CVIU，IVC，MVA，PR，JMIV，IJPRAI…

（2）发表在2000年以后

（3）SCI检索次数大于1000，来源于Web of Science数据库，2012年12月初的检索结果

Top 20 榜单原文请见http://www.cnblogs.com/youth0826/archive/2012/12/04/2801481.html

　　看了一下这20篇博文，总体上感觉很熟悉，很多文章确实是视觉领域2000年以来的重要工作，于是就很想聊一下自己的看法，和大家交流。

　　我简单按照所属领域划分统计了一下，其中：
　　与人脸检测识别直接相关的有3篇，间接相关的1篇，直接相关的包括：7（基于adaboost的人脸检测），19（人脸检测的综述），12（经典的人脸识别测试集FERET的说明），间接相关的是AAM，AAM是人脸alignment的最经典文章，但是由于其提出时并没有现定于人脸，所以划分为间接相关；

　　与局部描述子直接相关的有3篇，分别是1（sift），15（local descriptor的综述），17（LBP）；
　　与立体视觉相关的有3篇：9（摄像机标注方法），10（图像配准综述），14（这篇文章我不熟悉，所以这样划分是否合理也不是很确信）；

　　与图像分割直接相关的有2篇，间接相关的有1篇，直接相关的包括：2（normlized cut），13（graph-cut的应用），间接相关的是4（mean-shift），mean-shfit可以应用于图像分割，也可以应用于目标跟踪，算是间接相关；

　　与物体检测跟踪（为了简单，把检测和跟踪划分到一起，其实这两类方法在思路上差别很大，单独划分更合理，但是从功能角度确实很相似）直接相关的2篇，间接相关的有1篇：3（基于轮廓的物体检测方法），16（基于kernel的tracking方法）一篇是检测，一篇是跟踪，而基于mean-shift的跟踪方法是particle filter之前最经典的方法，算是间接相关；

　　与图像检索匹配相关的文章2篇：6（综述），11（shape context）；
　　此外还包括一篇统计模式识别的综述（8）；
　　一篇图像质量评估的方法（5）；
　　行为识别：18（一篇关于行为识别的系统的文章，用到了跟踪、摄像机标定、行为识别等）；
　　（其中mean-shift被计算了两次，所以和是21篇）

　　按照每个领域的文章数量由多到少的顺序我讲一下自己的观点：

　　人脸识别领域的论文出现次数最多（这可能和我自己重点关注人脸识别领域有关），是让我比较意外的，不过这说明从2000年开始，人脸识别方法得到了大家的重点关注，是视觉领域的一个热点。这几篇文章中，viola的基于adaboost+haar的人脸检测方法是经典中的经典，其思想不仅被广泛应用于物体检测领域，同时，在启发了狠多特征选择领域的工作，同时，也帮助adaboost一跃成为和svm并列的两大machine learning利器，我一直认为这篇文章和和lowe的sift都是视觉领域工程方面的经典之作；而AAM方法，也是十分重要的模型，尤其是对于脸部特征点定位而言，基于aam的改进工作极大促进了特征点定位的精度，其实这种全局形状约束+局部表观模型的思路在其他如物体检测领域也有很多类似思路；局部描述子，基本上是视觉领域表示方面十年来最大的一个亮点和趋势。我们知道模式识别包含两个方面的内容，一个是特征提取，用于提供更有鉴别力的表示，一个是机器学习，用来对于特征表示之后的数据上学习得到分类模型。而局部描述子已经成为特征表示的一个共识，无论是物体匹配检索、物体检测识别，采用多种局部描述子表示已经成为基本选择。而这其中，sift无疑是影响最大的工作之一，其在物体匹配、物体检索、物体检测、物体识别等领域都有大量应用。而LBP特征，作为一种局部描述特征，是继Gabor之后最重要的纹理描述特征（当然，sift的变种hog也是之一），其有很多变种，在人脸识别、物体检测、目标分类领域也得到了大量应用；

　　立体视觉我不熟悉，我就不献丑了。对于9和14两篇文章有这么高的引用率，不知道谁能讲讲背后的背景？

　　图像分割可以通过将分割问题看作是一个分组问题，然后定义一个优化目标，通过最优化这个目标来得到最优的模型参数。而graph-cut，是将每个pixel看作图中的一个节点，将图像分割转化为一个图分割问题。而graph-cut是通过最小分割和最小流来得到一个最优模型，2（normlized-cut）是为了克服graph-cut的缺点的一种改进，第2高的引用率应该说明这种方法可以应用于很多领域，包括图像分割和聚类。物体检测跟踪领域是一个十分活跃的领域，而3和16有这么高的引用率很出乎我的意料，因为这两种思路在最近基本都不算是主流思路，也许是当年曾经火过一段时间吧；物体检测识别的经典思路应该有两种，一种是基于滑动窗口搜索的，就是viola人脸检测文章中使用过的，后来，有基于hog+svm的行人检测的经典论文也是相近的框架，还有一种是基于图像全局表示的，经典的方法是基于bag of word的方法，在图像检测、图像分类、图像检索等领域都有重要应用；而跟踪的方法，比较经典的包括基于mean shift的方法，基于particle filter的方法，以及基于online-learning的方法，而后来的发展，也越来越将detection和tracking结合到一起，将二者结合到一个框架，其本质思想就是把tracking看作是一个区分前景目标和背景目标的分类问题，而detection提供了前景目标的off-line模型，tracking提供了on-line模型。这个领域论文很多，有一篇综述写得还不错。图像检索是当前视觉领域一个十分热的方向，在搜索引擎、购物等领域受到很多关注；而6和11远远不能涵盖这个领域的经典。11是早期物体匹配的经典方法，但是，现在用的已经很少。而这方面的最经典工作还应该是基于bag of word的工作。这个工作借鉴了文字搜索领域的工作，通过视觉词将图像转化为类似文字中的文章，视觉特征用视觉词频表示，然后通过倒排的方式，使得大规模图像检索成为可能。其它的三篇文章，8作为综述，确实没有什么疑问。5有这么高的引用，我有点迷惑。图像质量评估虽然在实际中十分重要，但是是个不太活跃的领域，有这么高的应用有点意外。18的工作比较早，当时能提出基于跟踪、摄像机标定、行为识别和事件检测这样的框架，确实有很棒的前瞻性，可能是因为近几年智能视频监控应用火热之后，做这个方向的工作多起来的原因吧。

一点建议：　　

　　1 建议将综述排除出去，20篇论文里面有5篇综述，虽然综述很重要，5篇也不是很多，但是在引用次数上综述确实会占很大便宜，建议将综述排除出去，只对提出新方法的文章单独排名，才能让大家对哪些新方法的影响力最广更了解；

　　2 我不知道这个排名方法是否存在瑕疵，或者是数据是否完全正确，因为我觉得从目前的结论来看，这20篇文章还不能算是最有影响力的20篇；

原文：https://blog.csdn.net/tiandijun/article/details/48949463

posted on 2019-01-18 13:49 洪卫阅读(2340) 评论(0) 收藏举报

刷新页面返回顶部

最有影响力的计算机视觉会议及期刊论文

1 最有影响力的30篇计算机视觉会议论文

选取论文的原则：

简单小结：

最后额外推荐几篇ML的方法，来自于ICML和NIPS。

2 最有影响力的20篇计算机视觉期刊论文

选取论文的原则：

导航

公告