箱线图 拓展(缺口箱线图)等
https://www.bilibili.com/video/BV1SX4y1S7vj/










"notch", 直译就是"缺口"


"notch"是用于检验两组的中位数是否显著不同, 如果不重叠, 就是95%置信度下, 显著不同, 如果重叠, 就是95%置信度下, 不显著.
notch"的计算方法:
"notch"的计算方法我找到了两处来源, 一处是<The R book>这本书中的描述, 另一处来自于MATLAB的boxplot的源代码.
<The R book>中为1.58倍的IQR/sqrt(n), 而MATLAB的boxplot代码中为1.57倍(1.57倍的IQR/sqrt(n)),差别不大。
如果两个箱型的"notch"没有重叠, 则表示它们的中位数显著不同.(以上示例图中的,每个示例图中的三组箱型之间的缺口都有重叠)。

从数值角度来看, IQR(箱型图中的实体部分)越大, "notch"越大, 这个符合直觉, 因为IQR越大, 表明数据的离散程度越大, 中位数的不确定也应该越大.
从数值角度来看, 样本数量越多, "notch"越小, 这个也是符合直觉的, 因为样本越多, 不确定越小.





浙公网安备 33010602011771号