4.K均值算法--应用
1. 应用K-means算法进行图片压缩
读取一张图片
观察图片文件大小,占内存大小,图片数据结构,线性化
用kmeans对图片像素颜色进行聚类
获取每个像素的颜色类别,每个类别的颜色
压缩图片生成:以聚类中收替代原像素颜色,还原为二维
观察压缩图片的文件大小,占内存大小
源代码:
from sklearn.cluster import KMeans import matplotlib.pyplot as plt import sys import numpy as np image=plt.imread("./shuju/xiaoxin.jpg") #plt.imshow(img) print("压缩前图片大小:",image.size) print("压缩前图片占用的内存:",sys.getsizeof(image)) img=image[::2,::2] #为了研究方便,这里先降低分辨率,每隔2个像素取一个点 x=img.reshape(-1,3) #对颜色进行聚类 model=KMeans(n_clusters=16) #这里我们只取16种颜色 labels=model.fit_predict(x) #对X进行训练和聚类 colors = model.cluster_centers_ #查看聚类中心 newImage = colors[labels].reshape(img.shape) print("压缩后的图片的大小:",newImage.size) print("压缩后的图片占用的内存:",sys.getsizeof(newImage)) plt.imshow(newImage.astype(np.uint8))
结果:

 压缩前:
压缩后:
2. 观察学习与生活中可以用K均值解决的问题
从数据-模型训练-测试-预测完整地完成一个应用案例。
这个案例会作为课程成果之一,单独进行评分。
 
                    
                
 
 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号