4 k均值应用
1. 应用K-means算法进行图片压缩
读取一张图片
观察图片文件大小,占内存大小,图片数据结构,线性化
用kmeans对图片像素颜色进行聚类
获取每个像素的颜色类别,每个类别的颜色
压缩图片生成:以聚类中收替代原像素颜色,还原为二维
观察压缩图片的文件大小,占内存大小
from sklearn.datasets import load_sample_image
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.image as img
import sys
china=load_sample_image('china.jpg')#原始图片
plt.imshow(china)
plt.show()
image=china[::3,::3]#降低原始图片的分辨率
plt.imshow(image)
plt.show()
#利用Kmeans对图片进行压缩
x=image.reshape(-1,3)#改变数组的形状
n_colors=64
model=KMeans(n_colors)
labels=model.fit_predict(x)
colors=model.cluster_centers_
new_image=colors[labels].reshape(image.shape)#然后用聚类中心的颜色代替原来的颜色值。
new_image=new_image.astype(np.uint8)
plt.imshow(new_image)#形成新的图片
plt.show()
#观察原始图片与新图片所占用内存的大小。
print(sys.getsizeof(china))
print(sys.getsizeof(new_image))
#将原始图片与新图片保存成文件,观察文件的大小。
img.imsave('D:/人工智能\image/china.jpg',china)
img.imsave('D:/人工智能\image/new_china.jpg',new_image)
原图:
原始图片与新图片所占用内存的大小:

图片大小:

2. 观察学习与生活中可以用K均值解决的问题。
从数据-模型训练-测试-预测完整地完成一个应用案例。
这个案例会作为课程成果之一,单独进行评分。

浙公网安备 33010602011771号