1.读取一张示例图片或自己准备的图片,观察图片存放数据特点。

from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
china = load_sample_image("china.jpg")
plt.imshow(china)
plt.show()
china

2.根据图片的分辨率,可适当降低分辨率。

image = china[::3, ::3]
X = image.reshape(-1,3)
print(china.shape,image.shape,X.shape)

3.

再用k均值聚类算法,将图片中所有的颜色值做聚类。

然后用聚类中心的颜色代替原来的颜色值。

形成新的图片。

import matplotlib.image as img
cd = img.imread('C:\\Users\\Administrator\\cold.png')
plt.imshow(cd)
plt.show() #导出自己准备的图片

n_colors = 64
model = KMeans(n_colors)
labels = model.fit_predict(X)
colors = model.cluster_centers_
plt.imshow(cd);
plt.show()
plt.imshow(image.astype(np.uint8))
plt.show()

 

4.

观察原始图片与新图片所占用内存的大小。

将原始图片与新图片保存成文件,观察文件的大小。

import sys
print(sys.getsizeof(cd))
print(sys.getsizeof(image)) 

import matplotlib.image as img
img.imsave('F:\\cd.png',cd)
img.imsave('F:\\cd_change.png',image) #将原始图片与新图片保存成文件,观察文件的大小。

 

 

 

 

 

 

理解贝叶斯定理:

  • M桶:7红3黄
  • N桶:1红9黄
  • 现在:拿出了一个红球
  • 试问:这个红球是MN桶拿出来拿出来的概率分别是多少?