3.K均值算法

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

31张牌,随机抽了3张K、10、5然后进行k均值聚类3类

 

K、10、5 —> K、9、4

 

K、9、4 —> K、9、3(分类完毕)

 

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

import matplotlib.pyplot as plt

import numpy as np

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

iris = load_iris()

sl=iris.data[:,1]

X=sl.reshape(-1,1)

a = KMeans(n_clusters=3)

a.fit(X)

y_kmeans = a.predict(X)#预测每个样本的聚类索引

plt.scatter(X[:, 0], X[:, 0], c=y_kmeans, s=50, cmap='rainbow',marker='x');

plt.show()

 

4). 鸢尾花完整数据做聚类并用散点图显示.

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import load_iris

data = load_iris()

X1 =iris.data#数据

a1=KMeans(n_clusters=3) #配置,构造

a1.fit(X1)#训练

y_kmeans1 = a1.predict(X1) #预测

y_kmeans = a.predict(X)#预测每个样本的聚类索引

plt.scatter(X1[:, 2], X1[:, 3], c=y_kmeans, s=50, cmap='rainbow',alpha=0.5,marker='*');

plt.show()

 

5).想想k均值算法中以用来做什么?

 可以通过k均值算法进行库存分类例如按销售活动分组库存或者按制造指标对库存进行分组也可以用来识别不同类型的癌症特征。

posted on 2020-04-13 21:24  [︵︵]  阅读(181)  评论(0)    收藏  举报