摘要:
1 k-means算法小结 优点: 1.原理简单(靠近中心点),实现容易 2.聚类效果中上(依赖K的选择) 3.空间复杂度o(N),时间复杂度o(IKN) N为样本点个数,K为中心点个数,I为迭代次数 缺点: 1.对离群点、噪声敏感(中心点易偏移) 2.很难发现大小差别很大的簇及进行增量计算 3.结 阅读全文
posted @ 2021-09-26 18:39
Trouvaille_fighting
阅读(955)
评论(0)
推荐(0)
摘要:
1 误差平方和(SSE) 误差平方和的值越小越好 在k-means中的应用: 公式各部分内容(k=2): 举例: 下图中数据-0.2, 0.4, -0.8, 1.3, -0.7, 均为真实值和预测值的差 总结: SSE图最终的结果,对图松散度的衡量.(eg: SSE(左图)<SSE(右图)) SSE 阅读全文
posted @ 2021-09-26 10:57
Trouvaille_fighting
阅读(7915)
评论(0)
推荐(1)
摘要:
1 K-means解释 k-means其实包含两层内容: - K : 初始中心点个数(计划聚类数) - means:求中心点到其他数据点距离的平均值 2 k-means聚类步骤 1、随机设置K个特征空间内的点作为初始的聚类中心 2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚 阅读全文
posted @ 2021-09-26 10:49
Trouvaille_fighting
阅读(2215)
评论(0)
推荐(0)
摘要:
1 api介绍 sklearn.cluster.KMeans(n_clusters=8) 参数: n_clusters:开始的聚类中心数量,产生的质心数。 方法: estimator.fit(x) estimator.predict(x) estimator.fit_predict(x) fit_p 阅读全文
posted @ 2021-09-26 10:20
Trouvaille_fighting
阅读(187)
评论(0)
推荐(0)
摘要:
1 聚类算法的概念 一种典型的无监督学习算法, 主要用于将相似的样本自动归到一个类别中 计算样本和样本之间的相似性,一般使用欧式距离 聚类算法分类 粗聚类 细聚类 2 聚类算法与分类算法最大的区别 聚类算法是无监督的学习算法,而分类算法属于监督的学习算法。 3 聚类算法在现实中的应用 用户画像,广告 阅读全文
posted @ 2021-09-26 09:58
Trouvaille_fighting
阅读(1281)
评论(0)
推荐(0)

浙公网安备 33010602011771号