假设检验是用来判断样本与样本,样本与整体之间的差异是由抽样误差引起还是本质差别造成;
参数假设检验:总体分布类型已知,用样本指标对总体参数进行推断统计分析方法;
非参数统计:不对总体分布假设(总体分布未知),即所判断的的假设不涉及总体参数的统计推断;
 
  • 正态总体单样本假设性检验
  • 均值检验
1.1方差已知
某汽车厂商承诺其生产的汽车每加仑汽油行驶不低于25英里,标准差为2.4英里;现在抽取视为车主的行驶数据为c(22,24,21,24,23,24,23,22,21,25),假设每加仑汽油行驶里程服从正态分布,则汽车厂商的承诺是否可靠?
检验步骤:
1、给出假设:
          H0:U>=35
          H1:U<25
2、给定检验水平:    σ=0.05
3、枢轴量:U=样本均值-整体均值/(整体方差/样本数开方)
4、计算枢轴量对应的P值/4
5、若U落在拒绝域内,则决绝原假设,反之不能拒绝原假设
这里我们自己编写一个可进行单边,双边检验的函数:
由结果可以看出来p<0.05,那么拒绝原假设,接受备择假设。说明厂商的承诺是无效的
 
1.2方差未知
检验步骤一直,只不过枢轴量变化
枢轴量:U=样本均值-整体均值/(样本方差/样本数开方)
还按照上面的例子假设整体方差未知,那么可以使用R语言自带函数t.test(x,mu=,alternative=)
检验结果看出,样本均值为22.9,P<0.05拒绝原假设,说明厂商陈诺无效
 
  • 2.方差检验
对于某一整体服从X~N(mu,σ^2),我们除了上一部分检验样均值是否符合,还要检验方差(标准差)是否符合
假设某废水处理厂规定处理后有毒物质浓度为X~N(500,20^2),随机抽查20份样本进行试验,看是否满足该结果;
首先要按照一节检验样本均值
这里为了简单,随机生成20个服从该正态分布样本
x<-rnorm(20,mean=500,sd=20)
均值检验可以看出接收原假设,均值等于500
 
接下来进行方差检验
检验步骤和均值检验一样,
枢轴量为χ^2=(n-1)s^2/σ0^2 服从χ^2(n-1) 卡方分布
这里自编函数var.test1
结果可以看出p>0.05没有落在拒绝域,接受原假设
综上说明,该废水处理厂运行正常
 
  • 正态总体双样本参数假设检验
又分为两独立样本均值检验和两配对样本均值检验
  • 两独立样本均值检验(先检验两独立样本方差是否一致,然后在检验两独立样本均值是否一致)
  • 方差齐性检验
具体理论推导不再阐述,如需要了解,自行百度;
例:
     某人好奇公交和开车哪个上班时间更短,通过两种方式各实验10次。gongjiao<-c(48,47,44,45,46,47,43,47,42,48),kaiche<-c(36,45,47,38,39,42,36,42,46,35)
过程:
     原假设两个时间一样
     1、检验样本是否服从正态分布,这里假设服从正态分布(具体检验是否服从正态分布,以后会讲到)
     2、判断两样本方差是否相同
可以看到两样本方差不一致
     3、t检验均值判断
结果表示拒绝原假设,且开车时间显著性小于公交时间
posted on 2015-08-26 17:08  博士数据组  阅读(905)  评论(0)    收藏  举报