摘要:
最近在摆弄数据离散度的时候遇到一种图形,叫做盒图(boxplot)。它对于显示数据的离散的分布情况效果不错。盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。如上图。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须(whisker)”。由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体 阅读全文
posted @ 2014-03-31 17:00
香格里拉\(^o^)/
阅读(4160)
评论(0)
推荐(0)
摘要:
什么是标准差(standard deviation)呢?根据国际标准化组织(ISO)的定义:标准差σ是方差σ2的正平方根;而方差是随机变量期望的二次偏差的期望,这个就不用解释了。 什么是标准误差(standard error)呢?看了些文献,有的还是大牛的,定义都不统一,通常来说有两种定义方式: 1、样本容量为的标准误差是样本的标准差除以。ps:这里还有人用样本的标准差除以n来作为标准误差(估计是弄错了,不过标准误差是基于总体均值来估计标准差,所以也没有必要说人家错); 2、一个统计量的标准误差还可以用估计误差的标准差来刻画即:。 下边来自编辑学报郝拉娣的《标准差与标准误》,相关性也... 阅读全文
posted @ 2014-03-31 12:59
香格里拉\(^o^)/
阅读(14961)
评论(0)
推荐(0)
浙公网安备 33010602011771号