论文:18.8.17-Neural Body Fitting: Unifying Deep Learning and Model-Based Human Pose and Shape Estimation

论文信息:

  地址:https://arxiv.org/abs/1808.05942

       代码:有

        日期 :2018/8/17

一、网络框架

  论文中提出一个从图像中预测SMPL模型的shape和pose参数的框架,称之为NBF(Neural Body Fitting)。NBF将3D模型和CNN相结合,利用了语义分割(semantic segmentation)技术,可以进行细粒度的全面的模型fitting。同时提供3D和2D的监督方法,可以根据可用数据集的情况灵活训练。

                                                                                 

   两个阶段:

    · 使用CNN,从原始图像中得到segmentation图像;

              · 使用CNN,从segmentation图像中预测shape和pose参数,生成3D/2D关节点坐标,进行优化。

二、损失函数

    · 3D latent parameter loss : 计算预测的pose和shapec参数与ground truth之间的L1损失

                                        

                        需要注意的是,这里把pose转换成旋转矩阵,也就是说网络预测的是旋转矩阵。

              ·  3D joint loss : 计算预测出来的3D 关节点坐标与ground truth之间的L2损失

                                     

              ·  2D joint loss : 计算由预测出来的3D关节点坐标投影到2D与ground truth之间的L2损失

                                       

              ·  joint 2D and 3D loss : 同时使用3D 2D joint loss     

                                     

 三、实验结果

  1. 使用segmentation,而不是直接使用RGB图像。

            原因:作业认为RGB图片中的有些信息(光照,外观,服装)在预测3D的shape和pose参数时是具有干扰性的,segmentation/heatmap这种中间表示中已经包含了足够的关键信息

            此外,作者研究了人体不同尺度分割的大小(1,3,6,12,24)对网络性能的影响,选择了分割为12部分。

                                                                          

  2.  作者研究了分割精度对网络性能的影响,得到segmentation的精确性对预测的准确性有很大影响。

                                                        

  3. 作者研究使用不同的损失函数组合,比较其影响:

 

                                                         

       4. 作者研究使用3D监督信息与2D监督信息的比例对性能的影响:

                                                          

       5. 在HumanEva-I 和 Human 3.6M数据集上的效果:

                                       

  6. 错误案例

                           由分割带错误造成的结果

                     

                           分割准确,由网络自身造成的错误

                     

 

posted @ 2020-08-18 19:44  此间一看客  阅读(865)  评论(0)    收藏  举报