numpy数据集

#1. 安装scipy，numpy，sklearn包
from sklearn.datasets import load_iris
#导入numpy
import numpy
#2. 从sklearn包自带的数据集中读出鸢尾花数据集data

#3.查看data类型，包含哪些数据
data = load_iris()
print(type(data))
print(data.keys())

#4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型
 #鸢尾花特征
iris_feature = data_iris['data']  
print(iris_feature)
#鸢尾花类型
iris_target = data_iris['target'] 
print(iris_target)

# 5.取出所有花的花萼长度(cm)的数据
iris_len=numpy.array(list(len[0] for len in data['data']))
print(iris_len)

# 7.取出某朵花的四个特征及其类别。
print(data['data'][0],data['target_names'][0])

# 8.将所有花分成三个组，每组50个

iris_setosa=[]      
iris_versicolor=[]
iris_virginica=[]

for i in range(0,150):        
    if data['target'][i]==0:
        data1=data['data'][i].tolist()
        data1.append('setosa')
        iris_setosa.append(data1)
    elif data['target'][i]==1:
        data1=data['data'][i].tolist()
        data1.append('versicolor')
        iris_versicolor.append(data1)
    else:
        data1=data['data'][i].tolist()
        data1.append('virginica')
        iris_virginica.append(data1)

#9.生成新的数组，每个元素包含四个特征+类别
datas=numpy.array([iris_setosa,iris_versicolor,iris_virginica])
print(datas)

posted @ 2018-11-05 08:55 狮大大丶阅读(504) 评论(0) 收藏举报

刷新页面返回顶部

狮大大丶

numpy数据集

公告