因为在研究Six Sigma,需要用到如 标准差 这种 概率论与数理统计 里的概念,但是由于个人经历,没有上过这门课程。

没办法,自己找资料来学吧。

下面的翻译,因为不熟悉专业名词,就保留原文吧。如果有问题请指正,谢谢。
原文链接:
http://www.robertniles.com/stats/

Mean
最常见的统计学工具之一,并且易于计算。全部【相加】,再除以【个数】。举个例子:
比方说你现在要为World Wide Widget公司进行统计。该公司9名职员的薪水如下:

总裁年薪:$100,000
2个经理,每人年薪:$50,000
4个工人年薪:$15,000
2个学徒年薪:$9,000

所以你把所有薪水加起来:$100,000 + $50,000 + $50,000 + $15,000 + $15,000 + $15,000 + $15,000 + $9,000 + $9,000(上面工资表中所有的数值),总和是$278,000。然后再除以9(职员人数)

最后,你得到了Mean:$30,889.

不是个很差的平均年薪,是吧?但是注意:WWW公司全部9名职员中只有3名职员可以挣到这个数字,而其他6个人甚至不能挣到这个平均值的一半。

那么,我们应该用什么样的统计工具来分析WWW公司【普通职员】能挣多少呢?现在让我们来看看Median。

Median
无论何时,如果你发现自己在写如【普通职员】,或是【普通家庭】这类字眼,你不会想去用前面讲到的那种平均值Mean。你需要那种能确实表示大众化情况的统计工具,这就是Median。

同样,这个统计也很好用:正如它字面意思一样,Median就是处在中间的值。只要把你的数值从大到小排列起来,中间的那个值就是你的Median。

就WWW公司的情况来说,让我们来排列一下他们的工资:
For the World Wide Widget Co., here are the worker's salaries:
$100,000
$50,000
$50,000
$15,000
$15,000
$15,000
$15,000
$9,000
$9,000

这里有9个职员,那么正好会有个人处在9个人的中间位置,即第五个值:$15,000。这就是Median。(如果你的数值是偶数,那么去算中间2个值的Mean,即把2个最中间的值加起来除以2)

比较同一集合的mean和median,可以让你知道该集合中数值分部情况。在这个例子里面,WWW公司总裁的薪水和普通员工的薪水水平就差距很大。(当然,在现实世界中,仅仅9个数字远远不够提供什么有价值的信息。但是在这里说明概念就够了)

再来一个例子:10个人在Redmond(译注:微软总部所在地)赶公交车。这10个人年薪的Mean是$50,000,他们年薪的Median恰好也是$50,000。

Joe Blow下了车,Bill Gates上了车。

现在,这些乘客年薪的Median仍然是$50,000,但是Mean却攀升到$50 million这样让译者眼红的数字-_-。有人可以说现在这些乘客的平均年薪是$50 million,但事实上其他9名乘客并没有因为Bill Gates上了车就变成了百万富翁。当我们在讨论这辆车上【普通乘客】的年薪时,仍然应该使用Median值:$50,000,这样才能反应真实的情况。

(统计学有个概念被称为:standard deviation,它会告诉我们在一个集合中各个值的分部密度。)

下一课:Percent Change
Percent Change可以很好的帮助人们理解随时间变化的数值。同样,学习这个不会用到比小学3年级数学更高深的知识。

用新值减去旧值,然后再除以旧值,就得到了你要的Percent Change。

例如,Springfield和Capital City去年都有50个罪犯。看起来2个城市的治安都一样,不是吗?也许是,也许不是。让我们来看看2个城市以前的犯罪记录,这样可以用Percent Change来进行比较。

5年前,Captial CIty有42个罪犯,而Springfield只有29个。

新值减去旧值,再除以旧值。好了,你算出来的吧?在5年时间里,Capital City的罪犯增长了19%,而Springfield增长了72%!

理解?

等等!在你计算Percent Change的时候,还有些东西需要考虑。让我们来看看Per Captia

Per Capita
当你在比较多组数字时,Percent change只能让你了解事实的部分真相。另一个重要的统计学概念是每组数值的Per Capita。这个概念能帮助你在不同大小的组间进行比较。

再让我们来看看Springfield和Captial City。今年有800,000人居住在spingfield,600,000居住在Capital City。但是在5年前,Springfield只有450,000人,而Capital City有550,000居民。

为什么这个很重要呢?因为这事实上说明了在过去5年里,Sprinefield市的扩张速度远远大于Captial City。这就解释为何Sprinefield会有更高的犯罪增长率。毕竟,一个城市拥有更多的人口自然也会出现更多的罪犯。

为了找到究竟哪个城市更危险一些,你需要计算一个per capita的罪犯比例(a per capita murder rate),即多少人中会出一个罪犯。

为了找到这个比例,只需要将罪犯的数量除以该市的人口数量。为了得到比较少的小数点,我们一般会在结果上乘以100,000,即每100,000人中会出现多少罪犯。

拿Sprinefield来说哦,50个罪犯除以800,000人,可以得到大约100,000人中有6.25个罪犯。Capital City则是50除以600,000,得100,000人中有8.33个罪犯。

5年前,Springfield的29个罪犯除以当时的人口450,000,大约是每100,000人中有6.44个罪犯。而Capital City是用42个罪犯除以550,000,得到每100,000人中有7.64个罪犯。

仅仅看Percent的话,我们会认为:在过去5年里,Springfield犯罪率增长了72%,而Capital City只有19%。但现在我们分析Per Capita,可以发现每100,000人中,Springfield的犯罪人数下降了近3%,而Capital City增长了近9%。。。

这才是真实的情况。。。

下一课:Standard Deviation
(未完待续)