会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
qwer123875
博客园
首页
新随笔
联系
订阅
管理
2021年6月18日
对LOL游戏数据集进行可视化分析
摘要: 一、理解数据 1、采集数据 本数据集来源于https://tianchi.aliyun.com/dataset/dataDetail?dataId=90273。 本数据集描述了LOL游戏相关信息,共包含51000条数据,共61个字段。下面是该数据集中包含的字段以及对各字段的解释: gameId(游戏
阅读全文
posted @ 2021-06-18 16:27 qwer123875
阅读(1307)
评论(0)
推荐(0)
2021年3月31日
数组中最大的子数组之和
摘要: 一、程序分析 1、题目要求 从文件中读取内容作为数组数据 输出这个数组的最大联通子数组 给出单元测试、代码覆盖率等报告 2、代码实现 def read_file(file_path,ResultLst): data="" with open(file_path,encoding="utf-8") a
阅读全文
posted @ 2021-03-31 18:46 qwer123875
阅读(71)
评论(1)
推荐(0)
2021年3月13日
数据质量分析
摘要: 本文读取了csv文件,完成了下列要求 输出数据集的基本信息和最大值,最小值,平均值; 统计缺失的变量和样本个数; 通过箱式图判断异常点。 1.读取csv文件 import pandas as pd from matplotlib import pyplot as plt import matplot
阅读全文
posted @ 2021-03-13 23:04 qwer123875
阅读(102)
评论(1)
推荐(0)
数组中最大的子数组之和
摘要: 一、程序分析 使用Python语言进行编译,读取一个文件,内容包括数组数和数组元素个,求数组中的最大子数组之和 class MSA: #读取文件 def read_file(self,file_path): with open(file_path, "r") as f: str = f.read()
阅读全文
posted @ 2021-03-13 19:22 qwer123875
阅读(150)
评论(3)
推荐(0)
2021年3月5日
数据挖掘十大经典算法
摘要: 一、C4.5(决策树) 决策就是对于一个问题,有多个答案,选择答案的过程就是决策。 C4.5算法是用于产生决策树的算法,主要用于分类。 C4.5使用信息增益率做计算(ID3算法使用信息增益做计算)。 原理 C4.5选择最有效的方式对样本集进行分裂,分裂规则是分析所有属性的信息增益率。 信息增益率越大
阅读全文
posted @ 2021-03-05 15:46 qwer123875
阅读(308)
评论(0)
推荐(0)
公告