数据挖掘与算法 第九次作业
from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as img import numpy as np #读取一张示例图片或自己准备的图片,观察图片存放数据特点。 china = load_sample_image("china.jpg") plt.imshow(china) plt.show() print(china.shape)
运行结果:

#根据图片的分辨率,可适当降低分辨率 image=china[::3,::3] plt.imshow(image) plt.show()
运行结果:

#再用k均值聚类算法,将图片中所有的颜色值做聚类 x=image.reshape(-1,3) n_colors=64 #(256,256,256) model=KMeans(n_colors) #64类聚类中心 labels=model.fit_predict(x) #每个点的颜色所属类别,0-63 colors=model.cluster_centers_ #64类聚类中心值 #然后用聚类中心的颜色代替原来的颜色值,形成新的图片 new_image=colors[labels] #进行颜色填充 new_image=new_image.reshape(image.shape) plt.imshow(new_image.astype(np.uint8)) plt.show()
运行结果:

#观察原始图片与新图片所占用内存的大小。 import sys print(sys.getsizeof(china)) print(sys.getsizeof(new_image))
运行结果:

#将原始图片与新图片保存成文件,观察文件的大小 import matplotlib.image as img img.imsave("c:\\图片\china.jpg",china) img.imsave("c:\\图片\china_zip.jpg",image)
运行结果:

练习二:理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
把计算过程与结果拍照发上来。

浙公网安备 33010602011771号