统计学基础(上)
本文主要是对公开课《简单统计学》及书本《商务与经济统计》的学习笔记及练习.
一、统计基本概念
统计基本范围

统计工作流程

随机变量的种类

二、常用统计量及统计图表
连续型数据特征值的计算
-
集中趋势的度量
平均数、中位数、众数; -
分散趋势的度量
全距、方差(变异数)、标准差; -
分布形态的度量
偏度、峰度; -
相关关系的度量
协方差、相关系数;
下面是一些用来表示样本统计量和总体参数的符号,

连续型数据特征值的应用
-
经验法则(切比雪夫定理的应用)
-
五数概括法(five-number summary)
-
箱型图(box plot)
常用统计图表
-
类别变量及离散变量
条形图、饼图、柏拉图(帕累托图); -
数值变量及连续变量
点图、直方图、散点图;
Excel练习

以上是2011年欧美10部电影的有关数据,完整的100部电影的数据获取路径:
http://pan.baidu.com/s/1sj1PHk5
-
描述统计
数据选项->数据分析->描述统计
![描述统计.png enter description here]()
-
相关分析
数据选项->数据分析->相关系数/散点图
![相关系数.png enter description here]()
![散点图1.png enter description here]()
![散点图2.png enter description here]()
-
异常值检测
用到了四分位点函数QUARTILE(array,quart),条件计数函数COUNTIF,条件函数IF
![四分位数.png enter description here]()
Excel中需借助股价图绘制箱体图,但是由于取值为实际的最大值和最小值,对异常值的检测没有意义,这里仅用于练习箱体图的绘制.
![箱体图.png enter description here]()
-
动态图表
用到了名称管理器、OFFSET函数、复选框;这里的动态图表对电影数据的分析没有太大用处,仅用于练习动态图表的绘制.
![动态图表.png enter description here]()







浙公网安备 33010602011771号