4.K均值算法--应用

1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

源代码:

from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import sys
import numpy as np
image=plt.imread("./shuju/xiaoxin.jpg")
#plt.imshow(img)
print("压缩前图片大小:",image.size)
print("压缩前图片占用的内存:",sys.getsizeof(image))
img=image[::2,::2]  #为了研究方便,这里先降低分辨率,每隔2个像素取一个点

x=img.reshape(-1,3) #对颜色进行聚类
model=KMeans(n_clusters=16) #这里我们只取16种颜色
labels=model.fit_predict(x)  #对X进行训练和聚类
colors = model.cluster_centers_  #查看聚类中心
newImage = colors[labels].reshape(img.shape)

print("压缩后的图片的大小:",newImage.size)
print("压缩后的图片占用的内存:",sys.getsizeof(newImage))
plt.imshow(newImage.astype(np.uint8))

 

结果:

 

 压缩前:

 

 

压缩后:

 

 

2. 观察学习与生活中可以用K均值解决的问题

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一,单独进行评分。

 

posted @ 2020-04-18 20:49  曾宇慧  阅读(147)  评论(0)    收藏  举报