1101 作业

一、读取一张示例图片或自己准备的图片，观察图片存放数据特点。

from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np

china = load_sample_image("china.jpg")
plt.imshow(china)
plt.show()

二、根据图片的分辨率，可适当降低分辨率。

image = china[::3,::3]
X = image.reshape(-1,3)
print(china.shape,image.shape,X.shape)

三、再用k均值聚类算法，将图片中所有的颜色值做聚类，然后用聚类中心的颜色代替原来的颜色值。

n_color = 64
model = KMeans(n_color)
labels = model.fit_predict(X)
colors = model.cluster_centers_

四、形成新的图片。

plt.imshow(image);
plt.show()
plt.imshow(image.astype(np.uint8))
plt.show()

五、观察原始图片与新图片所占用内存的大小。将原始图片与新图片保存成文件，观察文件的大小。

import sys
print(sys.getsizeof(china))
print(sys.getsizeof(image))

import matplotlib.image as img
img.imsave('F:\\china.jpg',china)
img.imsave('F:\\china_zip.jpg',image)