数据挖掘与算法 第九次作业

from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as img
import numpy as np

#读取一张示例图片或自己准备的图片,观察图片存放数据特点。
china = load_sample_image("china.jpg")
plt.imshow(china)
plt.show()
print(china.shape) 

运行结果:

 

 

#根据图片的分辨率,可适当降低分辨率
image=china[::3,::3] 
plt.imshow(image)
plt.show()

运行结果:

 

 

#再用k均值聚类算法,将图片中所有的颜色值做聚类
x=image.reshape(-1,3)
n_colors=64 #(256,256,256)
model=KMeans(n_colors)  #64类聚类中心
labels=model.fit_predict(x) #每个点的颜色所属类别,0-63
colors=model.cluster_centers_  #64类聚类中心值

#然后用聚类中心的颜色代替原来的颜色值,形成新的图片
new_image=colors[labels]  #进行颜色填充
new_image=new_image.reshape(image.shape)
plt.imshow(new_image.astype(np.uint8)) 
plt.show()

运行结果:

 

 

#观察原始图片与新图片所占用内存的大小。
import sys
print(sys.getsizeof(china))
print(sys.getsizeof(new_image))

运行结果:

 

 

#将原始图片与新图片保存成文件,观察文件的大小
import matplotlib.image as img
img.imsave("c:\\图片\china.jpg",china)
img.imsave("c:\\图片\china_zip.jpg",image)

运行结果:

练习二:理解贝叶斯定理:

  • M桶:7红3黄
  • N桶:1红9黄
  • 现在:拿出了一个红球
  • 试问:这个红球是M、N桶拿出来的概率分别是多少?

把计算过程与结果拍照发上来。

 


 

posted on 2018-11-06 20:43  Z诗M7642  阅读(134)  评论(0)    收藏  举报