K-means算法应用:图片压缩
读取一张示例图片或自己准备的图片,观察图片存放数据特点。
根据图片的分辨率,可适当降低分辨率。
再用k均值聚类算法,将图片中所有的颜色值做聚类。
然后用聚类中心的颜色代替原来的颜色值。
形成新的图片。
观察原始图片与新图片所占用内存的大小。
将原始图片与新图片保存成文件,观察文件的大小。
代码:
from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import sys #读取一张示例图片或自己准备的图片,观察图片存放数据特点。 china = load_sample_image("china.jpg") #加载实例图片 plt.imshow(china) plt.show() print(china.shape) # 根据图片的分辨率,可适当降低分辨率。 imgs = china[::3,::3] #降低分辨率 plt.imshow(imgs) plt.show() # 再用k均值聚类算法,将图片中所有的颜色值做聚类。 X = imgs.reshape(-1,3) # 重造数组n_clusters= 64 #(256,256,256) n_clusters=64 model= KMeans(n_clusters) #64个聚类中心 labels = model.fit_predict(X) #每个点的颜色所属类别,0-63类 colors = model.cluster_centers_ #64个聚类中心,颜色值 print(china.shape,imgs.shape,X.shape) # 然后用聚类中心的颜色代替原来的颜色值。 new_imgs=colors[labels] #把每个点替换成相对应的类别值 # 还原到原来的维度并转换数据类型 new_imgs=new_imgs.reshape(imgs.shape) new_imgs = new_imgs.astype(np.uint8) plt.imshow(new_imgs); plt.show() # 将原始图片与新图片保存成文件,观察文件的大小。 plt.imsave('D:\\imgs\\china.jpg',china) plt.imsave('D:\\imgs\\new_imgs.jpg',new_imgs) S1 = sys.getsizeof('D:\\imgs\\china.jpg') #对比文件大小 S2 = sys.getsizeof('D:\\imgs\\new_china.jpg') print('压缩前:'+str(S1),"压缩后:"+str(S2))
运行结果:


理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?


浙公网安备 33010602011771号