摘要: 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴。但横轴也不一定是连续型变量,可以是有序的离散型变量... 阅读全文
posted @ 2016-04-13 19:53 穆晨 阅读(40145) 评论(0) 推荐(2) 编辑
摘要: 数据可视化中,最常用的图非条形图莫属,它主要用来展示不同分类(横轴)下某个数值型变量(纵轴)的取值。其中有两点要重点注意:1. 条形图横轴上的数据是离散而非连续的。比如想展示两商品的价格随时间变化的走势,则不能用条形图,因为时间变量是连续的;2. 有时条形图的值表示数值本身,但也有时是表示数据集中的频数,不要引起混淆.... 阅读全文
posted @ 2016-03-30 11:31 穆晨 阅读(68865) 评论(1) 推荐(2) 编辑
摘要: 绘制统计图形时,半数以上的时间会花在调用绘图命令之前的数据塑型操作上。在把数据送进绘图函数之前,需要将数据集转换为适当的格式才行。本文将给出使用R语言进行数据塑型的一些基本的技巧,更多技术细节推荐参考《R语言核心手册》... 阅读全文
posted @ 2016-03-29 19:53 穆晨 阅读(21119) 评论(1) 推荐(6) 编辑
摘要: 上一篇重点讲解了数据仓库建模,它是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及其他一些组件的开发,其中包括ETL工程,在线分析处理工具(OLAP)和商务智能(BI)应用等。本文将对这些方面做一个总体性的介绍(尤其是OLAP),旨在让读者对数据仓库的认识提升到一个全局性的高度... 阅读全文
posted @ 2016-03-28 19:08 穆晨 阅读(52359) 评论(11) 推荐(18) 编辑