摘要: 一、理解数据 1、采集数据 本数据集来源于https://tianchi.aliyun.com/dataset/dataDetail?dataId=90273。 本数据集描述了LOL游戏相关信息,共包含51000条数据,共61个字段。下面是该数据集中包含的字段以及对各字段的解释: gameId(游戏 阅读全文
posted @ 2021-06-18 16:27 qwer123875 阅读(1307) 评论(0) 推荐(0)
摘要: 一、程序分析 1、题目要求 从文件中读取内容作为数组数据 输出这个数组的最大联通子数组 给出单元测试、代码覆盖率等报告 2、代码实现 def read_file(file_path,ResultLst): data="" with open(file_path,encoding="utf-8") a 阅读全文
posted @ 2021-03-31 18:46 qwer123875 阅读(71) 评论(1) 推荐(0)
摘要: 本文读取了csv文件,完成了下列要求 输出数据集的基本信息和最大值,最小值,平均值; 统计缺失的变量和样本个数; 通过箱式图判断异常点。 1.读取csv文件 import pandas as pd from matplotlib import pyplot as plt import matplot 阅读全文
posted @ 2021-03-13 23:04 qwer123875 阅读(102) 评论(1) 推荐(0)
摘要: 一、程序分析 使用Python语言进行编译,读取一个文件,内容包括数组数和数组元素个,求数组中的最大子数组之和 class MSA: #读取文件 def read_file(self,file_path): with open(file_path, "r") as f: str = f.read() 阅读全文
posted @ 2021-03-13 19:22 qwer123875 阅读(150) 评论(3) 推荐(0)
摘要: 一、C4.5(决策树) 决策就是对于一个问题,有多个答案,选择答案的过程就是决策。 C4.5算法是用于产生决策树的算法,主要用于分类。 C4.5使用信息增益率做计算(ID3算法使用信息增益做计算)。 原理 C4.5选择最有效的方式对样本集进行分裂,分裂规则是分析所有属性的信息增益率。 信息增益率越大 阅读全文
posted @ 2021-03-05 15:46 qwer123875 阅读(308) 评论(0) 推荐(0)