Unconstrained Face Alignment via Cascaded Compositional Learning
\documentclass{article} %article文章
%\documentclass[journal]{IEEEtran}
\usepackage{cTex} %使用中文字符
\usepackage{amsmath} %使用数学公式
\usepackage{amssymb}
%\usepackage[colorlinks]{hyperref} %超级链接宏包
\usepackage[pagebackref,colorlinks]{hyperref} %超级链接宏包
\usepackage[top=1in,bottom=1in,left=1.25in,right=1.25in]{geometry} %设置也边距
\usepackage{caption}
\usepackage[ruled,vlined]{algorithm2e}%算法
\renewcommand{\algorithmcfname}{算法} %%将算法的标题:从Algorithm 1 到 算法1.
%%===设置参考文献===
\renewcommand{\refname}{参考文献}
%%==图片序号与标题之间的冒号改为空格,将图片序号中的”Fig”改为”图“
\captionsetup[figure]{labelsep=space}
%%==设置字体===
\newcommand{\wuhao}{\fontsize{10.5pt}{\baselineskip}\selectfont} %五号
\newcommand{\liuhao}{\fontsize{7.875pt}{\baselineskip}\selectfont} %六号
\setmainfont{Times New Roman} % 全局西文用 Times New Roman 字体
\setCJKmainfont{SimSun} % 全局中文用 Adobe Song Std 字体
\title{Unconstrained Face Alignment via Cascaded Compositional Learning}
\date{}
\author{\footnote{xuluhui123@126.com}}
\renewcommand \figurename {\liuhao 图}
\begin{document}
\maketitle
\section*{摘要}
我们提出了一个实际的方法解决单幅图像无约束的人脸对齐问题。在我们的无约束问题中,我们需要处理大的头部姿态和丰富的形状变形引起的大的形状和表观的变化。为了能够在无约束的场景中,使我们的级联回归能够处理全局形状变化和不规则的表观- 形状关系,我们将优化空间分为多个同种类型的域,将从多个特定域的回归中估计的组合作为预测的形状。通过使用特定表示的学习目标函数和一个新的树分裂函数,我们的方法能够估计一个鲁棒性的,并且有意义的组合。由于使用了快速的域排除机制,以及利用了快速的像素特征,我们的方法的速度能够达到300FPS。并且在精度上超过了现有的方法。
\section{简介}
本文中,我们提出了一个有效的并且高效的无约束的人脸对齐方法。它不依赖于3D人脸模型和3D注释,没有假定头部姿态的范围。它能够很容易的处理整个AFLW数据集中的任意的角度以及丰富的表情。此外对齐只需要在单张图像上进行,而不需要时间先验。我们将给出这些吸引人的属性可以通过将流行的级联回归策略表示为一个级联的组合学习(cascaded compositional learning,CCL) 问题来完成。特别地,我们不使用单个级联回归来覆盖全局形状参数空间,和文献[37]一样,我将最优化空间划分成多个同种类型的域。针对每一个域使用一个特定域的级联回归。给定一幅测试图像,它的形状可以估计为各种DHDs(domains of homogeneous descent) 的组合形状。
\centering
\includegraphics[width=1\textwidth]{figure1.png}
\caption{\fontsize{7.875}{0.5\baselineskip}\selectfont {三种方法在AFLW数据集上的测试误差分布。我们选择两个因素,Yaw和嘴角的大小,为了可视化分布,并且提供5 个区域(I,V) 有代表性的人脸图像。通过观察可以看出,一个级联回归方法仅在前侧人脸区域获得小的误差。一个多视角的方法不能全面的解决全局形状和表观变化。我们的级联组合的学习在所有人脸中产生满意的结果.}} %captions 不采用自动编号
\label{fig-001}
\end{figure}
我们强调CCL拥有的一些唯一的属性:\
(i)\emph{鲁棒性的组合预测:}我们使用一个新的分裂函数,在一个决策树框架中估计一个组合矢量。函数的表示满足,其直接地最优化基准点的位置,因此,给定任意的姿态和人脸形变,可以产生精确的对齐。(如果优化参数的话,在后面我们会看到,小的形状参数误差并不对应小的基准点定位误差。)我们注意到这不是一个很天真的混合估计,我们需要确保这棵树能够估计有意义的一个组合,该组合捕捉域之间的唯一相关性,因此估计的组合矢量,语义上允许更相邻的域共享相似的推荐,而不是域空间的远离的域。(ii)快速:我们将方法表示为实时的丢弃无希望的域。此外该方法利用快速的像素差特征[5]。
\section{相关工作}
Jourabloo等人[18]提出了一个3D方法,即利用级联回归预测3D基形状的系数,和3D-2D的投影矩阵。我们在实验室中表明最优化基形状系数和投影是间接的,并且是次优的,因为更小的参数误差并不一定等价于更小的对齐误差[5]。Tulyakov等人将回归目标扩展到3D空间。然而,这个方法依赖于有形状变化限制的3D数据集,并且不能利用现有的2D自然场景下的数据集,例如AFLW和20K+数据集。Wu[34]等人提出了一个遮挡鲁棒的级联回归方法来处理极端的姿态和遮挡,但是它们的方法仅在少量的实验室环境下的挑战图像进行了验证,其缺乏特定的机制来处理任意形状变化,而不仅是两种标准的侧面视角。Hsu 等人[17]扩展了混合树模型[45],并且达到了更好的精度和效率。然而其是假定人脸形状是一个树结构,在形状变化了施加了强的约束。
\section{级联组合学习}
给定一个人脸图像
级联回归方法(例如[36,27]包含T次迭代,每次迭代过程通过下面的形式更新形状:
其中学习的线性回归
为了解决当局部回归应用到大的全局变换的形状时局部回归的限制,我们提出了将每一次迭代中的形状预测表示为多个DHDs 下的形状估计的组合。为了更精确的表示,我们定义一组特定域“局部-下降”回归
其中每一个域的下降
\textbf{域划分}.我们通过将所有的训练样本分为
\textbf{推断}.图
\centering
\includegraphics[width=\textwidth]{figure2.png}
\caption{\fontsize{7.875}{0.5\baselineskip}\selectfont {阐述了级联组合学习(CCL)的一次迭代。它包括三个步骤:1)鲁棒的特征映射,获得形状索引特征$\Phi^t(I;S^{t-1})$;2)每一个域获得回归形状$s_k^t$和相应的特征$\Phi'^t(I;s_k^t)$;3)预测组合$\mathbf p^t$,获得估计的形状$S^t$。因此,我们的模型每次迭代包括三个成分:特征的提取$\Phi^t$,一组局部回归器$W^t={w_1^t,...,w_k^t,...,w_K^t}$和组合估计器$f^t$.使用实时的域的排除机制,在步骤2中,如果第k个域在迭代前已经被排除,那么我们可以绕过$s_k^t$和$\Phi^t(I;s_k^t)$的计算。第k个域排除之后,$s_k^t$和$\Phi^t(I;s_k^t)$的值保持固定。}}% captions 不采用自动编号
\label{fig-002}
\end{figure}
\textbf{学习},我们连续的学习形状映射
\subsection{组合形状估计}\label{sec-031}
组合形状的学习包括学习
\indent 形状预测的难点源于组合
\indent 我们通过直接的优化组合形状
其中
\indent 为了快速的预测一个有意义的和鲁棒性的组合,我们选择随机森林模型作为等式
\indent 训练完后,我们的树结构包括下面的学习参数:1)每一个分裂或者叶子节点
\indent 在测试阶段,我们将每一个样本贯穿每一颗树,达到一个叶子节点。我们用
注意
\subsection{学习一个适当的特征映射}\label{sec-032}
\noindent
因此,类似于人脸检测应用[6],额外的包含了负的训练样本,如图
\indent 我们指出新特征的两个主要的优点。首先,特征中的指示器更好的对可视性信息进行了编码。这对于预测组合
\centering
\includegraphics[width=0.5\textwidth]{figure3.png}
\caption{\fontsize{7.875}{0.5\baselineskip}\selectfont {在当前的局部区域,测试人脸的左嘴角是不可见的.我们特征映射方法的树很令人满意的将样本送入到大多数树的“不可见”的叶子节点,同时原原来的LBF特征[27]包含很强的噪声.(b)典型的用来训练的训练样本。原始的LBF特征仅包括正样本的情况(+)}} %captions 不采用自动编号
\label{fig-03}
\end{figure}
\section{实验}
数据集.我们选择两种类型的数据集:In-the-wild 和Lab-Environment
\section{附录}
如何去求解公式
我们使用matlab工具包求解该二次规划问题。首先需要将二次规划问题转换为标准的二次规划形式:
\section{理解}
从公式
公式
其中
\indent 因此,提出了公式
其中
\indent 通过上面的训练后,我们会想怎么用呢?即测试的时候是什么样的情况?\
我们知道对于一个样本穿过随机森林中的每棵树,最终达到叶子节点。这样对于每棵树,都只达到一个叶子节点,我们将这些叶子节点中已知的训练样本搜集起来构成集合
注意:这里公式7的求解和上面的随机森林的求解不一样,这里是真正意义的优化,这里使用二次规划。因为这里的组合状态数量不是很大,例如是十几或者几十。我们可以利用matlab中的二次规划工具包。
二次规划问题的推导:
\centering
\includegraphics[width=0.5\textwidth]{figure3.png}
\caption{\fontsize{7.875}{0.5\baselineskip}\selectfont {在当前的局部区域,测试人脸的左嘴角是不可见的.我们特征映射方法的树很令人满意的将样本送入到大多数树的“不可见”的叶子节点,同时原原来的LBF特征[27]包含很强的噪声.(b)典型的用来训练的训练样本。原始的LBF特征仅包括正样本的情况(+)}} %captions 不采用自动编号
\label{fig-03}
\end{figure}
我们知道矩阵
\end{document}
posted on 2016-09-13 15:10 Raby_Draby 阅读(507) 评论(0) 收藏 举报
浙公网安备 33010602011771号