ID3决策树和神经网络建立银行分控模型

1.神经网络建立模型

  1.1 代码

 1 import pandas as pd
 2 import numpy as np
 3 # 参数初始化
 4 from keras.models import Sequential
 5 from keras.layers.core import Dense, Activation
 6 from cm_plot import *  # 导入自行编写的混淆矩阵可视化函数
 7 
 8 filename = 'data/bankloan.xls'
 9 data = pd.read_excel(filename)
10 
11 x_test = data.iloc[:,:8].values
12 y_test = data.iloc[:,8].values
13 
14 model = Sequential()  # 建立模型
15 model.add(Dense(input_dim = 8, units = 10))
16 model.add(Activation('relu'))  # 用relu函数作为激活函数,能够大幅提供准确度
17 model.add(Dense(input_dim = 18, units = 1))
18 model.add(Activation('sigmoid'))  # 由于是0-1输出,用sigmoid函数作为激活函数
19 model.compile(loss = 'binary_crossentropy', optimizer = 'adam')
20 # 编译模型。由于我们做的是二元分类,所以我们指定损失函数为binary_crossentropy,以及模式为binary
21 # 另外常见的损失函数还有mean_squared_error、categorical_crossentropy等,请阅读帮助文件。
22 # 求解方法我们指定用adam,还有sgd、rmsprop等可选
23 
24 model.fit(x_test, y_test, epochs = 100, batch_size = 10)  # 训练模型,学习一千次
25 
26 predict_x=model.predict(x_test)
27 classes_x=np.argmax(predict_x,axis=1)
28 
29 score  = model.evaluate(x_test,y_test,batch_size=10)  # 模型评估
30 print(score)
31
32 cm_plot(y_test,classes_x).show()  # 显示混淆矩阵可视化结果

 

其中自行编写的混淆矩阵可视化矩阵函数cm_plot如下:

 1 def cm_plot(y, yp):
 2   
 3   from sklearn.metrics import confusion_matrix 
 4 
 5   cm = confusion_matrix(y, yp) 
 6   
 7   import matplotlib.pyplot as plt
 8   plt.matshow(cm, cmap=plt.cm.Greens) 
 9   plt.colorbar() 
10   
11   for x in range(len(cm)): 
12     for y in range(len(cm)):
13       plt.annotate(cm[x,y], xy=(x, y), horizontalalignment='center', verticalalignment='center')
14   
15   plt.ylabel('True label') 
16   plt.xlabel('Predicted label') 
17   return plt

 

  1.2 模型验证结果

 

 

 

 

2. ID3决策树建立模型

 

  2.1 代码

 

 1 import pandas as pd
 2 # 参数初始化
 3 #导入数据
 4 filename = 'D:\ZNsmueven\Python/bankloan.xls'
 5 #filename = 'data/bankloan.xls'
 6 data = pd.read_excel(filename)  # 导入数据
 7 
 8 x = data.iloc[:,:8].astype(int)
 9 y = data.iloc[:,8].astype(int)
10 
11 import os
12 os.environ["PATH"] += os.pathsep + 'C:\Program Files\Graphviz\bin/'
13 
14 from sklearn.tree import DecisionTreeClassifier as DTC
15 dtc = DTC(criterion='entropy')  # 建立决策树模型,基于信息熵
16 dtc.fit(x, y)  # 训练模型
17 
18 # 导入相关函数,可视化决策树。
19 # 导出的结果是一个dot文件,需要安装Graphviz才能将它转换为pdf或png等格式。
20 from sklearn.tree import export_graphviz
21 x = pd.DataFrame(x)
22 
23 """
24 string1 = '''
25 edge [fontname="NSimSun"];
26 node [ fontname="NSimSun" size="15,15"];
27 {
28 ''' 
29 string2 = '}'
30 """
31  
32 with open("tree.dot", 'w') as f:
33     export_graphviz(dtc, feature_names = x.columns, out_file = f)
34     f.close()
35 
36 from IPython.display import Image  
37 from sklearn import tree
38 import pydotplus 
39 
40 dot_data = tree.export_graphviz(dtc, out_file=None,  #regr_1 是对应分类器
41                          feature_names=data.columns[:8],   #对应特征的名字
42                          class_names=data.columns[8],    #对应类别的名字
43                          filled=True, rounded=True,  
44                          special_characters=True)  
45  
46 dot_data = dot_data.replace('helvetica 14', 'MicrosoftYaHei 14') #修改字体
47 graph = pydotplus.graph_from_dot_data(dot_data)  
48 graph.write_png('D:\ZNsmueven\Python/banktree.png')    #保存图像
49 Image(graph.create_png())
50 
51 import matplotlib.pyplot as plt
52 img = plt.imread('D:\ZNsmueven\Python/banktree.png')
53 fig = plt.figure('show picture')
54 plt.imshow(img)

 

 

 

 

  2.2 模型验证结果

 

 

 

 

 

 

posted @ 2022-03-27 22:42  Ni__23  阅读(58)  评论(0)    收藏  举报