综述-human parsing

综述-human parsing
Deep Learning Technique for Human Parsing: A Survey and Outlook

人体解析旨在将图像或视频中的人体分割为多个像素级语义部位。过去十年间，该技术在计算机视觉领域获得了显著关注，并广泛应用于安防监控、社交媒体、视觉特效等诸多实际场景。尽管基于深度学习的人体解析方案已取得显著成果，但许多核心概念、现存挑战与潜在研究方向仍存在认知模糊。本综述系统回顾了三大核心子任务：单人解析、多人解析和视频人体解析，通过阐释各自的任务设定、背景概念、关联问题与应用场景，梳理代表性文献与数据集，并对基准数据集上的方法性能进行量化对比。此外，为促进该领域的可持续发展，我们提出基于Transformer的人体解析框架，通过通用、简洁且可扩展的解决方案为后续研究提供高性能基准。最后，我们指出了该领域尚未充分探索的开放性问题，并为未来研究指明新方向。项目主页将持续更新以追踪这一快速发展领域的最新进展：https://github.com/soeaver/awesome-human-parsing。

Human Parsing Taxonomy  体系
SHP: Single human parsing
MHP: Multiple human parsing
VHP: Video human parsing

posted @ 2025-09-09 09:26 剪水行舟154 阅读(70) 评论(0) 收藏举报

刷新页面返回顶部

综述-human parsing

公告