摘要: 1.什么是非负矩阵分解? NMF的基本思想可以简单描述为:对于任意给定的一个非负矩阵V,NMF算法能够寻找到一个非负矩阵W和一个非负矩阵H,使得满足 ,从而将一个非负的矩阵分解为左右两个非负矩阵的乘积。如下图所示,其中要求分解后的矩阵H和W都必须是非负矩阵。 分解前后可理解为:原始矩阵的列向量是对左 阅读全文
posted @ 2019-12-03 21:33 程序界第一佳丽 阅读(1827) 评论(0) 推荐(0)
摘要: 1.什么是LDA? LDA线性判别分析也是一种经典的降维方法,LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“*投影后类内方差最小,类间方差最大*”。 什么意思呢? 我们要将 阅读全文
posted @ 2019-12-03 21:05 程序界第一佳丽 阅读(1628) 评论(0) 推荐(0)
摘要: 1.什么是PCA? PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序 阅读全文
posted @ 2019-12-03 20:30 程序界第一佳丽 阅读(2091) 评论(0) 推荐(0)
摘要: 1.为什么要进行数据降维? 在实际的机器学习项目中,特征选择/降维是必须进行的,因为在数据中存在以下几个方面的问题: 数据的多重共线性:特征属性之间存在着相互关联关系。多重共线性会导致解的空间不稳定, 从而导致模型的泛化能力弱; 高纬空间样本具有稀疏性,导致模型比较难找到数据特征; 过多的变量会妨碍 阅读全文
posted @ 2019-12-03 19:31 程序界第一佳丽 阅读(1043) 评论(0) 推荐(0)