数据挖掘与算法 第六次作业
#1.导入nampy 导入鸢尾花数据 import numpy as np from sklearn.datasets import load_iris #2. 从sklearn包自带的数据集中读出鸢尾花数据集data from sklearn.datasets import load_iris data = load_iris() #3.查看data类型,包含哪些数据 print("数据类型:",type(data)) print("数据类目:",data.keys()) #4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 iris_feature = data.feature_names,data.data print("鸢尾花特征:",iris_feature) print("iris_feature数据类型",type(iris_feature)) iris_target = data.target print("鸢尾花数据类别:",iris_target) print("iris_target数据类型:",type(iris_target)) #5.取出所有花的花萼长度(cm)的数据 sepal_len = np.array(list(len[0] for len in data.data)) print("花萼长度:",sepal_len) #6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 petal_length = np.array(list(len[2] for len in data['data'])) petal_length.resize(15,10) petal_width = np.array(list(len[3] for len in data['data'])) petal_width.resize(15,10) iris_lens = (petal_length,petal_width) print('所有花瓣的长度+宽度是:',iris_lens) #7.取出某朵花的四个特征及其类别。 print("特征:",data.data[1]) print("类别:",data.target[1]) #8.将所有花的特征和类别分成三组,每组50个 iris_set = [] iris_ver = [] iris_vir = [] #定义三个列表来存放不同类型花朵的类别 for i in range(0, 150): if data.target[i] == 0: Data = data.data[i].tolist() Data.append('setosa') iris_set.append(Data) elif data.target[i] == 1: Data = data.data[i].tolist() Data.append('versicolor') iris_ver.append(Data) else: Data = data.data[i].tolist() Data.append('virginica') iris_vir.append(Data) #9.生成新的数组,每个元素包含四个特征+类别 datas = (iris_set,iris_ver,iris_vir) print("新的数组:",datas)
运行结果:



浙公网安备 33010602011771号