《机器学习》（4）

from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as np
from sklearn import tree

# Iris数据集是常用的分类实验数据集，
# 由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，
# 是一类多重变量分析的数据集。数据集包含150个数据集，
# 分为3类，每类50个数据，每个数据包含4个属性。
# 可通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类中的哪一类。

# 载入数据集
iris = datasets.load_iris()
# sklearn中的iris数据集有5个key：
# [‘target_names’, ‘data’, ‘target’, ‘DESCR’, ‘feature_names’]
iris_data = iris['data']
iris_label = iris['target']
iris_target_name = iris['target_names']
X = np.array(iris_data)
Y = np.array(iris_label)
print(X)
# 训练
# 决策树算法
clf = tree.DecisionTreeClassifier(max_depth=3)
clf.fit(X, Y)

# 这里预测当前输入的值的所属分类
print('类别是', iris_target_name[clf.predict([[12, 1, -1, 10]])[0]])

posted @ 2021-01-29 21:46 祈欢阅读(51) 评论(0) 收藏举报

刷新页面返回顶部

祈欢

《机器学习》（4）

公告