作业6
鸢尾花数据集
1.安装
①python -m pip install --upgrade pip
②pip uninstall numpy
③pip uninstall scipy
④pip install scipy
⑤pip install numpy
⑥pip install sklearn
2.从sklearn包自带的数据集中读出鸢尾花数据集data
from sklearn.datasets import load_iris
iris = load_iris()
3.查看iris类型,包含哪些数据
print('iris类型:',type(iris))
print('数据:',iris.keys())#包含哪些数据
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
a = iris['feature_names']
b = iris['target_names']
c = iris['data']
print(a)
print(b)
print(c)
print(type(a),type(b),type(c))
5.取出所有花的花萼长度(cm)的数据
sepal_len = np.array(list(len[0] for len in data.data))
print(sepal_len)
6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
for i in iris['data']:
petal_length = i[2]
petal_width = i[3]
print(petal_length,petal_width)
7.取出某朵花的四个特征及其类别。
print(data.data[1])
print(data.target[1])
8.将所有花的特征和类别分成三组,每组50个
iris_a=[]
iris_b=[]
iris_c=[]
for i in range(0,150):
if iris['target'][i]==0:
data1=iris['data'][i].tolist()
data1.append('setosa')
iris_a.append(data1)
elif iris['target'][i]==1:
data1=iris['data'][i].tolist()
data1.append('versicolor')
iris_b.append(data1)
else:
data1=iris['data'][i].tolist()
data1.append('virginica')
iris_c.append(data1)
9.生成新的数组,每个元素包含四个特征+类别
array=np.array([iris_a,iris_b,iris_c])
print(array)
10.计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。
data_len=np.array(list(len[2] for len in iris['data']))
print(data_len)
print(np.max(data_len))
print(np.mean(data_len))
print(np.median(data_len))
print(np.std(data_len))
11.显示鸢尾花某一特征的曲线图,散点图。
import numpy as np
import matplotlib.pyplot as plt
datas = np.array(list(len[2] for len in iris['data']))
plt.plot(np.linspace(0,150,num=150),datas,'b')
plt.show()
plt.scatter(np.linspace(0,150,num=150),datas,marker='o')
plt.show()