作业6

鸢尾花数据集

1.安装
①python -m pip install --upgrade pip
②pip uninstall numpy
③pip uninstall scipy
④pip install scipy
⑤pip install numpy
⑥pip install sklearn

2.从sklearn包自带的数据集中读出鸢尾花数据集data
from sklearn.datasets import load_iris
iris = load_iris()

3.查看iris类型,包含哪些数据
print('iris类型:',type(iris))
print('数据:',iris.keys())#包含哪些数据
 
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

a = iris['feature_names']
b = iris['target_names']
c = iris['data']
print(a)
print(b)
print(c)
print(type(a),type(b),type(c))

5.取出所有花的花萼长度(cm)的数据

sepal_len = np.array(list(len[0] for len in data.data))
print(sepal_len)

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

 for i in iris['data']:
 petal_length = i[2]
 petal_width = i[3]
 print(petal_length,petal_width)

 

  7.取出某朵花的四个特征及其类别。

print(data.data[1])
print(data.target[1])

8.将所有花的特征和类别分成三组,每组50个

iris_a=[]
iris_b=[]
iris_c=[]
for i in range(0,150):
    if iris['target'][i]==0:
        data1=iris['data'][i].tolist()
        data1.append('setosa')
        iris_a.append(data1)
    elif iris['target'][i]==1:
        data1=iris['data'][i].tolist()
        data1.append('versicolor')
        iris_b.append(data1)
    else:
        data1=iris['data'][i].tolist()
        data1.append('virginica')
        iris_c.append(data1)
9.生成新的数组,每个元素包含四个特征+类别

array=np.array([iris_a,iris_b,iris_c])
print(array)

10.
计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。

data_len=np.array(list(len[2] for len in iris['data']))
print(data_len)
print(np.max(data_len))
print(np.mean(data_len))
print(np.median(data_len))
print(np.std(data_len))

11.
显示鸢尾花某一特征的曲线图,散点图。

 import numpy as np
 import matplotlib.pyplot as plt
 datas = np.array(list(len[2] for len in iris['data']))
 plt.plot(np.linspace(0,150,num=150),datas,'b')  
 plt.show()
 plt.scatter(np.linspace(0,150,num=150),datas,marker='o')
 plt.show()








 
 
 


 

 



 



 
 
posted @ 2018-10-29 22:45  四面楚歌·  阅读(163)  评论(0编辑  收藏  举报