随笔分类 -  数据分析

摘要:模型搭建和评估--建模 经过前面的两章的知识点的学习,我们可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。 阅读全文
posted @ 2021-07-21 20:42 呆叔编程567 阅读(509) 评论(0) 推荐(1)
摘要:复习:回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比 阅读全文
posted @ 2021-07-19 19:41 呆叔编程567 阅读(211) 评论(0) 推荐(0)
摘要:复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。 开始之前,导入numpy 阅读全文
posted @ 2021-07-16 21:36 呆叔编程567 阅读(247) 评论(0) 推荐(0)
摘要:【回顾&引言】前面一章的内容大家可以感觉到我们主要是对基础知识做一个梳理,让大家了解数据分析的一些操作,主要做了数据的各个角度的观察。那么在这里,我们主要是做数据分析的流程性学习,主要是包括了数据清洗以及数据的特征处理,数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫。 开 阅读全文
posted @ 2021-07-14 19:35 呆叔编程567 阅读(384) 评论(0) 推荐(0)
摘要:1 第一章:数据加载 1.1 载入数据 数据集下载 https://www.kaggle.com/c/titanic/overview 1.1.1 任务一:导入numpy和pandas 如果出现导入报错,请先确定是否已安装这两个python库。numpy的安装方法见Numpy官网: NumPy,pa 阅读全文
posted @ 2021-07-12 22:23 呆叔编程567 阅读(318) 评论(0) 推荐(0)