摘要:
前面学习的无监督学习模型:降维 另一种无监督学习模型:聚类算法。 聚类算法直接冲数据的内在性质中学习最优的划分结果或者确定离散标签类型。 最简单最容易理解的聚类算法可能是 k-means聚类算法了。 k-means简介 在不带标签的多维数据集中 寻找确定数量 的簇。 最优的聚类结果需要符合以下俩个假
阅读全文
posted @ 2022-06-08 21:36
llcl
阅读(241)
推荐(0)
摘要:
PCA对非线性的数据集处理效果不太好。 另一种方法 流形学习 manifold learning 是一种无监督评估器,试图将一个低维度流形嵌入到一个高纬度 空间来描述数据集 。 类似 一张纸 (二维) 卷起 弄皱 (三维)。二维流形 嵌入到一个三维空间, 就不再是线性的了。 流形方法技巧: 多维标度
阅读全文
posted @ 2022-06-08 21:08
llcl
阅读(268)
推荐(0)
摘要:
PCA principal component analysis 主成分分析是一个快速灵活的数据降维无监督方法, 可视化一个包含200个数据点的二维数据集 x 和 y有线性关系,无监督学习希望探索x值和y值之间的相关性 在主成分分析中。一种量化俩变量之间关系的方法 是在数据中找到一组主轴,并用这些主
阅读全文
posted @ 2022-06-08 20:10
llcl
阅读(157)
推荐(0)