上机实验
、上机实验一:数据准备与模型评估
1、实验目的
第九实验楼510-512
熟悉Python 的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;
加深对训练集、测试集、N折交叉验证、模型评估标准的理解。
2、实验内容
(1)利用pandas库从本地读取iris数据集;
(2)从scikit-learn 库中直接加载iris 数据集;
(3)实现五折交叉验证进行模型训练;
(4)计算并输出模型的准确度、精度、召回率和F1值。
3、操作要点
(1)安装Python及pycharm(一种Python开发IDE),并熟悉Python基本操作;
(2)学习pandas库里存取文件的相关函数,以及scikit-learn库里数据集下载、交叉验
证、模型评估等相关操作;
(3)可能用的库有pandas,scikit-learn,numpy 等,需要提前下载pip;
(4)测试模型可使用随机森林rf_classifier=RandomForestClassifier(n_estimators=100),
或其它分类器;
(5)撰写实验报告,提交源代码;实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及Python软件。
三、上机实验二:逻辑回归算法实现与测试
1、实验目的
深入理解对数几率回归(即逻辑回归的)的算法原理,能够使用Python语言实现对数
几率回归的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。
2、实验内容
推荐参考书:[1] 范淼, 李超.Python 机器学习及实践, 清华大学出版社.
[2] Peter Harrington. 机器学习实战, 人民邮电出版社。
(1)从scikit-learn 库中加载 iris 数据集或本地读取,进行数据分析;
(2)采用五折交叉验证划分训练集和测试集,使用训练集训练对数几率回归(逻辑回
归)分类算法;
(3)使用五折交叉验证对模型性能(准确度、精度、召回率和F1值)进行测试;
(4)通过对测试结果进行比较分析,评估模型性能;
(5)完成实验报告中实验二的部分。
3、操作要点
(1)可以选择自行编写源代码完成对数几率回归算法,或者调用scikit-learn库中的函
数;
(2)如果调用scikit-learn 库中的函数,需要说明函数各个参数的含义(名称)、解释或
说明(包括作用、取值等)、默认值(如有,可在备注列写出)等,即自行编写代码只需要
粘贴完整的带有注释的源代码即可,调用函数则包括粘贴源代码和函数参数说明两部分;
(3)一周内在超星作业提交源代码,打包命名;学号姓名-任务2;
(4)按要求撰写实验报告,实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及Python软件。
四、上机实验三:C4.5(带有预剪枝和后剪枝)算法实现与测试
1、实验目的
深入理解决策树、预剪枝和后剪枝的算法原理,能够使用Python语言实现带有预剪枝
和后剪枝的决策树算法C4.5算法的训练与测试,并且使用五折交叉验证算法进行模型训练
与评估。
2、实验内容
(1)从scikit-learn 库中加载 iris 数据集或本地读取,进行数据分析;
(2)采用五折交叉验证划分训练集和测试集,使用训练集对C4.5分类算法进行训练;
(3)使用五折交叉验证对模型性能(准确度、精度、召回率和F1值)进行测试;
(4)通过对测试结果进行比较分析,评估模型性能;
(5)完成实验报告中实验三的部分。
3、操作要点
(1)可以选择自行编写源代码完成决策树算法C4.5算法,或者调用scikit-learn库中的
函数;
(2)如果调用scikit-learn 库中的函数,需要说明函数各个参数的含义(名称)、解释或
说明(包括作用、取值等)、默认值(如有,可在备注列写出)等,即自行编写代码只需要
粘贴完整的带有注释的源代码即可,调用函数则包括粘贴源代码和函数参数说明两部分;
(3)一周内在超星作业提交源代码,打包命名;学号姓名-任务3;
(4)按要求撰写实验报告,实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及Python软件。
推荐参考书:[1] 范淼, 李超.Python 机器学习及实践, 清华大学出版社.
[2] Peter Harrington. 机器学习实战, 人民邮电出版社。
五、上机实验四:SMO算法实现与测试
1、实验目的
深入理解支持向量机(SVM)的算法原理,能够使用Python语言实现支持向量机的训
练与测试,并且使用五折交叉验证算法进行模型训练与评估。
2、实验内容
(1)从scikit-learn 库中加载 iris 数据集或本地读取,进行数据分析;
(2)采用五折交叉验证划分训练集和测试集,使用训练集对SMO支持向量机分类算
法进行训练;
(3)使用五折交叉验证对模型性能(准确度、精度、召回率和F1值)进行测试;
(4)通过对测试结果进行比较分析,评估模型性能;
(5)完成实验报告中实验四的部分。
3、操作要点
(1)可以选择自行编写源代码完成SMO支持向量机算法,或者调用scikit-learn库中
的函数;
(2)如果调用scikit-learn 库中的函数,需要说明函数各个参数的含义(名称)、解释或
说明(包括作用、取值等)、默认值(如有,可在备注列写出)等,即自行编写代码只需要
粘贴完整的带有注释的源代码即可,调用函数则包括粘贴源代码和函数参数说明两部分;
(3)一周内在超星作业提交源代码,打包命名;学号姓名-任务4;
(4)按要求撰写实验报告,实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及Python软件。
六、上机实验五:BP神经网络算法实现与测试
1、实验目的
深入理解BP神经网络的算法原理,能够使用Python语言实现BP神经网络的训练与测
试,并且使用五折交叉验证算法进行模型训练与评估。
2、实验内容
(1)从scikit-learn 库中加载 iris 数据集或本地读取,进行数据分析;
(2)采用五折交叉验证划分训练集和测试集,使用训练集对BP神经网络分类算法进
行训练;
(3)使用五折交叉验证对模型性能(准确度、精度、召回率和F1值)进行测试;
(4)通过对测试结果进行比较分析,评估模型性能;
(5)完成实验报告中实验五的部分。
3、操作要点
(1)可以选择自行编写源代码完成BP神经网络算法,或者调用scikit-learn库中的函
数;
(2)如果调用scikit-learn 库中的函数,需要说明函数各个参数的含义(名称)、解释或
推荐参考书:[1] 范淼, 李超.Python 机器学习及实践, 清华大学出版社.
[2] Peter Harrington. 机器学习实战, 人民邮电出版社。
说明(包括作用、取值等)、默认值(如有,可在备注列写出)等,即自行编写代码只需要
粘贴完整的带有注释的源代码即可,调用函数则包括粘贴源代码和函数参数说明两部分;
(3)一周内在超星作业提交源代码,打包命名;学号姓名-任务5;
(4)按要求撰写实验报告,实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及Python软件

浙公网安备 33010602011771号