K-means算法应用:图片压缩

读取一张示例图片或自己准备的图片,观察图片存放数据特点。

根据图片的分辨率,可适当降低分辨率。

再用k均值聚类算法,将图片中所有的颜色值做聚类。

然后用聚类中心的颜色代替原来的颜色值。

形成新的图片。

观察原始图片与新图片所占用内存的大小。

将原始图片与新图片保存成文件,观察文件的大小。

代码:

from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np
import sys

#读取一张示例图片或自己准备的图片,观察图片存放数据特点。
china = load_sample_image("china.jpg")  #加载实例图片
plt.imshow(china)
plt.show()
print(china.shape)
# 根据图片的分辨率,可适当降低分辨率。
imgs = china[::3,::3]   #降低分辨率
plt.imshow(imgs)
plt.show()

# 再用k均值聚类算法,将图片中所有的颜色值做聚类。
X = imgs.reshape(-1,3)   # 重造数组n_clusters= 64  #(256,256,256)
n_clusters=64
model= KMeans(n_clusters)  #64个聚类中心
labels = model.fit_predict(X)    #每个点的颜色所属类别,0-63类
colors = model.cluster_centers_   #64个聚类中心,颜色值
print(china.shape,imgs.shape,X.shape)

# 然后用聚类中心的颜色代替原来的颜色值。
new_imgs=colors[labels]  #把每个点替换成相对应的类别值
# 还原到原来的维度并转换数据类型
new_imgs=new_imgs.reshape(imgs.shape)
new_imgs = new_imgs.astype(np.uint8)
plt.imshow(new_imgs);
plt.show()
# 将原始图片与新图片保存成文件,观察文件的大小。
plt.imsave('D:\\imgs\\china.jpg',china)
plt.imsave('D:\\imgs\\new_imgs.jpg',new_imgs)
S1 = sys.getsizeof('D:\\imgs\\china.jpg')   #对比文件大小
S2 = sys.getsizeof('D:\\imgs\\new_china.jpg')
print('压缩前:'+str(S1),"压缩后:"+str(S2))

运行结果:

理解贝叶斯定理:

  • M桶:7红3黄
  • N桶:1红9黄
  • 现在:拿出了一个红球
  • 试问:这个红球是M、N桶拿出来的概率分别是多少?

 

posted @ 2018-11-06 11:15  W梨涡浅笑  阅读(230)  评论(0)    收藏  举报