Data Cafe

导航

 

统计学基础(上)

本文主要是对公开课《简单统计学》及书本《商务与经济统计》的学习笔记及练习.

一、统计基本概念

统计基本范围

enter description here

统计工作流程

enter description here

随机变量的种类

enter description here

二、常用统计量及统计图表

连续型数据特征值的计算

  • 集中趋势的度量
    平均数、中位数、众数;

  • 分散趋势的度量
    全距、方差(变异数)、标准差;

  • 分布形态的度量
    偏度、峰度;

  • 相关关系的度量
    协方差、相关系数;

下面是一些用来表示样本统计量和总体参数的符号,
enter description here

连续型数据特征值的应用

  • 经验法则(切比雪夫定理的应用)

  • 五数概括法(five-number summary)

  • 箱型图(box plot)

常用统计图表

  • 类别变量及离散变量
    条形图、饼图、柏拉图(帕累托图);

  • 数值变量及连续变量
    点图、直方图散点图;

Excel练习

enter description here

以上是2011年欧美10部电影的有关数据,完整的100部电影的数据获取路径:
http://pan.baidu.com/s/1sj1PHk5

  • 描述统计

    数据选项->数据分析->描述统计

    enter description here

  • 相关分析

    数据选项->数据分析->相关系数/散点图

    enter description here

    enter description here
    enter description here

  • 异常值检测

    用到了四分位点函数QUARTILE(array,quart),条件计数函数COUNTIF,条件函数IF

    enter description here

    Excel中需借助股价图绘制箱体图,但是由于取值为实际的最大值和最小值,对异常值的检测没有意义,这里仅用于练习箱体图的绘制.

    enter description here

  • 动态图表

    用到了名称管理器、OFFSET函数、复选框;这里的动态图表对电影数据的分析没有太大用处,仅用于练习动态图表的绘制.

    enter description here

posted on 2015-11-15 15:07  JaneDu  阅读(746)  评论(0)    收藏  举报