点估计和区间估计

统计学是通过什么检测两个变量之间是否有关系?

 

例如身高和性别是否有关系

答:通过检测男性样本的身高均值 VS 女性样本的身高均值 是否有差异,

有差异就说明两个变量之间存在关系。检验均值的差异是否为零,不看大小只看是否为零

 

参数估计

 

例题:北京市领导想知道当年住宅价格增长率是否达到了国家限定的阈值,比如10%

 

1.我们需要的是总体数据,但总体无法全部获取到,所以我们只能抽样,用样本去估计总体参数

2.拿到样本后,我们能得到样本的统计量(样本均值x、样本方差s2、样本标准差s)

3.我们实际想要的其实是总体参数(总体均值μ、总体方差σ2、总体标准差σ)

4.既然要用样本参数去估计总体参数,就有两种估计方法,一种是点估计,一种是区间估计。点估计记住下面两个公式

5.点估计的准确性如何呢?它取决于抽样的偏差,如果我们抽样不均衡会出现偏差,因此就出现了另一种估计方法,也就是区间估计。既然用一个点去估计存在偏差,那我们就使用一段区间,也就是所谓的置信区间。

置信区间怎么得到呢?以95%置信度为例,置信区间为,以样本均值为中心左右两个标准差之间的范围。

标准差从何而来呢?它是样本均值的标准差,也即标准误。为了计算样本均值的标准差,我们需要抽取多个样本 ,然后计算每个样本的均值,获得一组样本均值,然后再计算这些均值的标准差,这样就得到了标准误。

但是,缺点是我们需要多次取样,方能计算出标准误。不过统计学家给出了计算标准误的公式,这样就无需多次取样了。

 

这样我们就能可以计算置信区间了。

posted @ 2020-11-26 01:20  止一  阅读(1092)  评论(0编辑  收藏  举报