摘要: 降维算法应用:数据压缩、数据可视化。 主成分分析(PCA)是最常见的降维算法。 在 PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据 都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点 的向量,而投射误差是从特征向量向该方 阅读全文
posted @ 2019-08-15 23:34 Cutey_Thyme 阅读(816) 评论(0) 推荐(0)
摘要: 聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。 此次我们学习聚类中的第一个算法——K-均值算法。K-均值算法本质就是重复将样本分配的类里面,不断的更新类的重心位置。 这里将围绕K-均值算法讨论目标优化、随机初始化和如何选择聚类数。 K-M 阅读全文
posted @ 2019-08-15 22:52 Cutey_Thyme 阅读(721) 评论(0) 推荐(0)