4.2 MNIST-Back-Rand Dataset

MNIST-Back-Rand数据集包含0-9十个数字的50000张图片,它首先从MNIST数据集中挑选出来,然后在原始图像中加入随机噪声,转换成更复杂的图像。为了减少内存消耗,每个数字我们随机挑选10张图片,组成包含100个样本的子集。可以看出我们方法的优越性是很明显的。这个实验表明,当数据被非高斯噪声或复杂噪声污染时,我们提出的方法在Mog帮助下,对子空间聚类更加适用。

同时,我们也进行实验,观察高斯模型的个数K对我们提出的模型的聚类准确率的影响。我们可以看到,当高斯个数增加,准确率先是上升,然后开始波动,当K=5时,达到最大值。这是因为当高斯数目太少时,Mog可能无法准确地描述噪声,另一方面,当K过大时,计算成本会增加且分组效果会被抑制()。在这两种情况下,噪声的分布都没有模拟得很好。

 

4.3 AR数据集

AR数据集包含超过4000张人脸图像,对应126张人脸(70个男人和56个女人)。对于每个人脸,26张人脸图像分为两部分拍摄,这些图像有不同的面部变化,包括不同的面部表情(中性的,微笑的,生气的和尖叫的),光照变化(左侧灯亮,右侧灯亮,双侧灯同时亮),被太阳镜或围巾遮挡。

我们分别从这个数据集选取5个和10个例子进行子空间聚类。我们可以看到,Mog回归在两个聚类任务中都比其他方法效果要好。这是因为Mog回归在这个复杂数据集上有很强的分组效果。我们可以从图1中看出。

 

4.4 extended Yale face 数据集B

这个数据集包含38类共2414张正面人脸图像,其中每一类有64个人脸,在各种照明,姿势以及光照条件下获得。为减少计算成本和存储器要求,我们将灰度图像调整为32×32像素的分辨率。

为了评估不同方法的鲁棒性,我们在受噪声污染的Extended Yale Face Dataset B上进行实验,其中每个图片都由在区间0到255区间均匀分布的样本随机代替图像像素点,被污染像素的百分比从10%到100%。

从图5我们可以看出,当人脸图像被污染的百分比在10%到40%时,我们的方法优越性很明显,在噪声处理方面展示了很好的适用性和更好的鲁棒性。当污染的像素百分比高于60%,判别信息严重受损,所有方法的有效性都降低。

posted on 2016-11-28 10:04  嘀嘀嘎嘎唔  阅读(867)  评论(0编辑  收藏  举报