Reading papers_5(与human activity analysis综述相关,ing...)

读Poppe, R. (2010). "A survey on vision-based human action recognition." Image and Vision Computing 28(6): 976-990.

　　这篇文章写的是关于人体动作识别的综述类文章，论文中没有对某个具体的模型或算法做详细的描述，只是将其分类到作者框架下动作识别的一个研究方向。

　　在本篇论文的参考文献中，作者也列出了比较出名的此类综述性文章，但是每篇综述性文章的写作线索都不尽相同，这是因为每个学长对human action recognition的理解不完全相同。

　　本领域的一些难点和特点:1.人体动作的变种太多，同一种动作其变化有时候区分度很大，而不同动作的区分度有时候又不太不明显，所以随着动作类型的增多，其分类任务难度就增大了。2.环境变化太大，比如说背景杂乱，遮挡，光照，动态背景模型，运动摄像头等加大了动作识别的难度。3.动作的时间因素，如果视频的帧率不同，则相同动作持续的时间也不相同，增加了识别的难度。4.由于是视频数据，3维的，所以数据的获取和标注也相当困难。鉴于此，作者总结了一些常用的公开数据集。KTH，Weizmann，INRIA XMAS,UCF,Hollywood 等。

　　人体行为识别步骤大致分为2个部分：特征的描述+分类器。

　　特征的描述又分为全局描述,局部描述。

　　全局描述需要通过人体检测和跟踪来定位人体，然后对其进行特征提取来描述。因此其依赖于定位的精度。Grid-based方法用于解决全局描述对噪声，部分遮挡，视角变化的敏感弱点。运动能量图MEI和运动历史图MHI都是基于人体剪影的。另外2个代表是全局grid-based描述以及STV时空体描述。

　　局部描述是对人体单独patch进行提取的。首先是检测局部的特征点，然后通过某种方法连接起来作为整体的描述，比较成功的有bga-of-feature。局部描述的优点是对于光照，部分遮挡不是很敏感。其研究方向有时空兴趣点检测和描述，局部local-based描述，局部描述子之间的相关性。

　　当然除了全局和局部描述2种外，作者还总结了针对具体应用的描述子。

　　当目标特征被提取出来并且表示好之后，行为识别问题就变成了一个分类问题了。

　　首先是分类器中的直接分类器，在分类前需要对特征维数进行削减，常用的算法有PCA，流行学习等。KNN，SVM等都属于直接分类器。

　　其次就是时空状态模型，比如说DTW动态时间规整，HMM,CRF等。

　　最后作者提出了未来行为识别的研究热点：1.特征点描述的应用能力，比如说解决遮挡问题等。2.分类器的灵活性设计。3.算法的实时性。4.行为识别算法的平均标准等。

posted on 2012-05-01 22:37 tornadomeet 阅读(1201) 评论(0) 编辑收藏举报