Week8.2_PCA降维

主成分分析 PCA

1。作用:降维 数据更容易分析

2.核心:找到一个平面(线段、体)使得所有点到这个平面的距离最短

3.实现方法:1)mean normalization 均值归一化 (每个特征值的均值)or feature scaling 特征缩放

2)找到向量(线:一个向量,面:两个向量)

3)采用【u,s,v】(协方差)得到u,前k个就是投影的k个方向

4)乘上x 得到投影的函数z


1.k的选择使得99%的差异性得到保留,因为很多数据是相似的,所以压缩后也不会造成数据的失真、
2.采用【u,s,v】,只需要使用公式一次,就可以迭代k,找到差异值》99%

PCA在有监督学习中的加速 (只在训练集中使用)

  1. 提取出输入值

  2. 使用PCA使得维度降低

3.得到新的训练集


PCA推荐使用的情况:

  1. 避免过拟合(正则)
  2. 只有在内存太小,太慢收敛等情况下,才使用PCA,一般都会(x(i),y(i))进行计算
posted @ 2016-05-30 21:54  nice_day  阅读(179)  评论(0)    收藏  举报