非参数统计——第二章 单样本问题

2.1广义符号和相关的置信区间

非参数检验是在不知道总体分布的情况下所做的检验,符号检验是最简单的非参数检验

2.1.1 分位点检验

eg2.1,对城市花费指数进行分位点检验,按升序如下:
27.8 27.8 29.1 32.2 32.7 36.4 36.5 37.5 37.7 38.8 41.9 45.2 45.8 46.0 47.6 48.2 49.9 51.8 52.7 54.9 55.0 55.3 55.5 58.2 60.8 62.7 63.5 64.6 65.3 65.3 65.3 65.4 66.2 66.7 67.7 71.2 71.7 73.9 74.3 74.5 76.2 76.6 76.8 77.7 77.9 79.1 80.9 81.0 82.6 85.7 86.2 86.4 89.4 89.5 90.3 90.8 91.8 92.8 95.2 97.5 98.2 99.1 99.3 100.0 100.6 104.6 105.0 109.4 122.4
有人说64是他的中位数,有人说64是他的下分位数。由于样本中位数67.7,下分位数50.85,因此需要对两个位置参数进行检验

使用R语言进行检验如下

x <- c(27.8, 27.8, 29.1, 32.2, 32.7, 36.4, 36.5, 37.5, 37.7, 38.8, 41.9, 45.2, 45.8, 
46.0, 47.6, 48.2, 49.9, 51.8, 52.7, 54.9, 55.0, 55.3, 55.5, 58.2, 60.8, 62.7, 63.5, 
64.6, 65.3, 65.3, 65.3, 65.4, 66.2, 66.7, 67.7, 71.2, 71.7, 73.9, 74.3, 74.5, 76.2,
76.6, 76.8, 77.7, 77.9, 79.1, 80.9, 81.0, 82.6, 85.7, 86.2, 86.4, 89.4, 89.5, 90.3, 
90.8, 91.8, 92.8, 95.2, 97.5, 98.2, 99.1, 99.3 ,100.0, 100.6, 104.6, 105.0, 109.4, 122.4)
sign.test(x,0.5,64)

2.2 Wilcoxon符号秩检验,点估计和区间估计

2.2.1 Wilcoxon符号秩检验

由于广义符号检验只是考虑了观测值与原假设的中心位置之差的符号来进行检验,但是没有利用这些差的大小。因此,在符号检验中,每个观测值点的正号或负号仅代表了该点在中心位置的哪一边,而并没有表明该点距离中心的远近。因此wilcoxon检验就是将其位置远近引入,把观测值和原假设的中心位置之差的绝对值的秩分别按不同符号相加作为其检验统计量。
具体步骤如下:
(1) 对 i = 1 , . . . , n 计 算 ∣ X i − M 0 ∣ , 他 们 代 表 这 些 样 本 点 到 M 0 的 距 离 对i=1,...,n计算|{X_i-M_0}|,他们代表这些样本点到M_0的距离 i=1,...,nXiM0M0
(2) 将 上 述 得 到 的 n 个 值 进 行 排 序 , 并 找 出 相 对 应 的 秩 {将上述得到的n个值进行排序,并找出相对应的秩} n
(3) W + 等 于 X i − M 0 大 于 0 的 秩 的 和 , W − 代 表 小 于 0 的 秩 的 和 {W^+等于X_i-M_0大于0的秩的和,W^-代表小于0的秩的和} W+XiM00W0
(4) 在 双 边 检 验 中 , 取 m i n W + , W − , 对 于 单 边 检 验 , 根 据 相 应 的 方 向 取 对 应 的 统 计 量 {在双边检验中,取min{W^+,W^-},对于单边检验,根据相应的方向取对应的统计量} minW+,W,
(5)差Wilcoxon统计表得到最终结果。

2.3Cox-Stuart趋势检验

趋势检验与前面相似,一共有三种检验:
(1) H 0 : 无 增 长 趋 势 , H 1 : 有 增 长 趋 势 {H_0:无增长趋势},H_1:有增长趋势 H0:H1:
(2) H 0 : 无 减 少 趋 势 , H 1 : 有 减 少 趋 势 {H_0:无减少趋势},H_1:有减少趋势 H0:H1:
(3) H 0 : 无 趋 势 , H 1 : 有 增 长 或 减 少 趋 势 {H_0:无趋势},H_1:有增长或减少趋势 H0:H1:
进行检验的方式与符号检验类似:首先将样本分为两组,分别用 D i = x i − x i + c {D_i=x_i-x_{i+c}} Di=xixi+c的符号来衡量增减,之后便以符号检验的方式进行检验即可。

2.4随机性的游程检验

首先回想一下伯努利实验,实验的结果是0和1的,如果这个实验是随机的,那么不太可能出现很多1或很多0连在一起,也不太可能出现0和1交替出现的太频繁。因此考虑游程实验进行分析。首先定义一下游程:连在一起的0或1被称为游程。例如:
000111100011100
这里就出现了三个0游程,2个1游程,这里一共就为5个游程(R=5),其中0的总个数为8(m)个,1的总个数为7(n)个。总实验次数为N=m+n。
当然,并不是原始数据为0和1才可以做游程实验,当我们要检验一批数据的中位数是否为某个值时,可以用大于该值的定为1,小于该值的定为0,再进行游程实验。具体公式:在这里插入图片描述

参考书籍:非参数统计第四版.吴喜之.赵博娟编著

posted @ 2022-08-27 11:09  JOJO数据科学  阅读(117)  评论(0编辑  收藏  举报