随笔分类 -  【机器学习】数据探索

摘要:序言在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例—>饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图—>频数,非等距直方图—>频数密度) 4. 截止到某时间点的累计总量—>累积频数图... 阅读全文
posted @ 2018-06-04 21:38 FontTian 阅读(854) 评论(0) 推荐(0)
摘要:简介对于数据科学而言,我们要做的第一件事情,必然是了解我们的数据.而在数据探索期间,pandas和matplotlib 则是我们进行数据探索的利器.本文主要分为三个部分,第一部分是利用pandas进行一些基础的数据分析,第二部分是利用pandas自身功能进行一些有用的... 阅读全文
posted @ 2017-10-10 07:42 FontTian 阅读(217) 评论(0) 推荐(0)
摘要:原文链接:点击打开链接《机器学习实战-数据探索(1、变量识别;2、单变量分析;3、双变量分析)》机器学习实战-数据探索(缺失值处理)机器学习实战-数据探索(异常值处理)上面三篇文章介绍了数据探索的前五步,机器学习更多内容可以关注github项目:machine lea... 阅读全文
posted @ 2017-10-09 20:47 FontTian 阅读(162) 评论(0) 推荐(0)