综述-human parsing

综述-human parsing
Deep Learning Technique for Human Parsing: A Survey and Outlook

人体解析旨在将图像或视频中的人体分割为多个像素级语义部位。过去十年间,该技术在计算机视觉领域获得了显著关注,并广泛应用于安防监控、社交媒体、视觉特效等诸多实际场景。尽管基于深度学习的人体解析方案已取得显著成果,但许多核心概念、现存挑战与潜在研究方向仍存在认知模糊。本综述系统回顾了三大核心子任务:单人解析、多人解析和视频人体解析,通过阐释各自的任务设定、背景概念、关联问题与应用场景,梳理代表性文献与数据集,并对基准数据集上的方法性能进行量化对比。此外,为促进该领域的可持续发展,我们提出基于Transformer的人体解析框架,通过通用、简洁且可扩展的解决方案为后续研究提供高性能基准。最后,我们指出了该领域尚未充分探索的开放性问题,并为未来研究指明新方向。项目主页将持续更新以追踪这一快速发展领域的最新进展:https://github.com/soeaver/awesome-human-parsing。

Human Parsing Taxonomy  体系
SHP: Single human parsing
MHP: Multiple human parsing
VHP: Video human parsing

posted @ 2025-09-09 09:26  剪水行舟154  阅读(70)  评论(0)    收藏  举报