06 2021 档案

摘要:第三章 模型搭建和评估 经过前面的探索性数据分析我们可以很清楚的了解到数据集的情况,那么我们就要使用数据了,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是 阅读全文
posted @ 2021-06-23 17:44 herj-棒棒哒 阅读(491) 评论(0) 推荐(0)
摘要:回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib。 第二章:数据可视化 开始之前,导入numpy、p 阅读全文
posted @ 2021-06-21 22:37 herj-棒棒哒 阅读(1633) 评论(0) 推荐(0)
摘要:复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。 # 导入基本库impor 阅读全文
posted @ 2021-06-19 23:14 herj-棒棒哒 阅读(190) 评论(0) 推荐(0)
摘要:2.1 缺失值观察与处理 (1)请查看每个特征缺失值个数 df[df.Age.isna()] (2)缺失值处理方法 填充方法: 思考: 2.2 重复值观察与处理 由于这样那样的原因,数据中会不会存在重复值呢,如果存在要怎样处理呢 2.3 特征观察与处理 我们对特征进行一下观察,可以把特征大概分为两大 阅读全文
posted @ 2021-06-17 23:00 herj-棒棒哒 阅读(262) 评论(0) 推荐(0)
摘要:官网参考: http://pandas.pydata.org/ 1.1 Series 1.2 Dataframe 1.3 查看DataFrame数据的每列的名称 1.4 查看"Cabin"这列的所有值[有多种方法 思考 : 删除多列的方法 筛选逻辑: 任务一: 我们以"Age"为筛选条件,显示年龄在 阅读全文
posted @ 2021-06-17 18:28 herj-棒棒哒 阅读(134) 评论(0) 推荐(0)
摘要:本项目课程的主要目的熟悉numpy pandas的相关操作,掌握基本的数据分析流程,本篇文章主要学会如何加载数据,查看数据,然后学习Pandas一些基础操作,最后开始尝试探索性的数据分析 1.1 载入数据 数据集下载 https://www.kaggle.com/c/titanic/overview 阅读全文
posted @ 2021-06-14 22:07 herj-棒棒哒 阅读(600) 评论(0) 推荐(0)