随笔分类 - 【08】数据可视化_R语言实践

摘要: 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻:仔细分析数据是否合理;问:针对前两步工作搜集到的问题与业务方交流;切:结合业务方反馈的结果和项目需求进行数据分析。"望"的方法可以认为就是制作数据可视化图表的过程,而数据分布图无疑是非常能反映数据特征(用户症状)的。R语言提供了多种图表对数据分布进行描述,本文接下来将逐一讲解...阅读全文
posted @ 2016-04-25 14:52 穆晨 阅读(4250) | 评论 (0) 编辑
摘要: 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。同时散点图中常常还会拟合一些直线,以用来表示某些模型...阅读全文
posted @ 2016-04-23 10:40 穆晨 阅读(5122) | 评论 (0) 编辑
摘要: 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴。但横轴也不一定是连续型变量,可以是有序的离散型变量...阅读全文
posted @ 2016-04-13 19:53 穆晨 阅读(4482) | 评论 (0) 编辑
摘要: 数据可视化中,最常用的图非条形图莫属,它主要用来展示不同分类(横轴)下某个数值型变量(纵轴)的取值。其中有两点要重点注意:1. 条形图横轴上的数据是离散而非连续的。比如想展示两商品的价格随时间变化的走势,则不能用条形图,因为时间变量是连续的;2. 有时条形图的值表示数值本身,但也有时是表示数据集中的频数,不要引起混淆....阅读全文
posted @ 2016-03-30 11:31 穆晨 阅读(2897) | 评论 (0) 编辑
摘要: 绘制统计图形时,半数以上的时间会花在调用绘图命令之前的数据塑型操作上。在把数据送进绘图函数之前,需要将数据集转换为适当的格式才行。本文将给出使用R语言进行数据塑型的一些基本的技巧,更多技术细节推荐参考《R语言核心手册》...阅读全文
posted @ 2016-03-29 19:53 穆晨 阅读(4078) | 评论 (1) 编辑
摘要: ggplot2是R语言最为强大的作图软件包,强于其自成一派的可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。本文主要对ggplot2的可视化理念及开发套路做一个总体介绍,具体绘图方法(如折线图,柱状图,箱线图等)将在后面的文章中分别进行讲解...阅读全文
posted @ 2016-03-15 20:13 穆晨 阅读(3938) | 评论 (2) 编辑