Logarithmic transformation|Data transfer|MASS|Box-Cox
摘要:数据转换(Data transfer) 方差分析的前提是方差齐性,可以使用transfer改变方差使得方差变齐、不正态和outlier。 Logarithmic transformation使方差聚合。取平方使方差离散。二项分布使用反正弦转换。 注意:远远偏离0.5则不管用,在0.5附近则转不转都很
阅读全文
非参数检验|Sign test|Wilcoxon signed rank test|Wilcoxon rank sum test|Bootstrapping
摘要:非参数检验条件没有参数,因此就没有分布,利用数据等级之间的差距,依次赋值之后再用参数方法测试。将连续型变量转化为离散型变量,即顺序变量。与参数检验相比,正态分布较弱(p值有可能不显著,浪费信息,比如最大值不管是多大都设定为10,所以很好的抵消outlier影响),非正态分布用参数检验就是错误的,但是
阅读全文
独立性检验|适应性检验|卡方检验|离散型数据|连续型数据
摘要:卡方检验 离散型数据使用卡方检验,连续型数据用方差分析 适应性检验 卡方检验:实际与观测值之间的差距 最小二乘法是平方,最小一乘法四绝对值,用平方可以放大差异 独立性检验:PAB=PAPB t检验也是比较两个总体参数之间的差距,但是误差比较大,如果有四组数据两两比较,则六次都是大概率事件,则每次0.
阅读全文
双因子方差分析|adjusted R|强度|SSA|SSE|SST|
摘要:应用统计学 方差分析的基本假设: 组间组平均与总平均的不同是由treatment引发的。单个值与组平均的不同是由组内error引发的。 如果没有处理误差SSA=SSE,所以右尾假设如果F>1则处理效应更强 本质上样本方差,所以是总体方差的无偏估计。 描述强度: 增加n(维度),R变大,adjuste
阅读全文
方差分析|重复|指标|因素|处理效应|实验误差|实验设计可避免的误差|一般线性|广义线性
摘要:方差分析是均值检验的第四种。 指标是index,因素是factor。 重复是排除个体感受后认为是同一条件,eg:10个相同条件的人为10个重复,此时排除了这些人的个体感受。 方差是数据的离散程度,方差分析是研究造成差异性的原因,即造成数据离散的原因。 观测值差异可分为三部分,处理效应、实验误差和实验
阅读全文
s检验|k-S检验|适应性检验|独立性检验|Cintinuity correction |Fisher‘s Exact Test|Likelihood Ratio|Person Chi-Square|φ系数|Cramer’s V|列联系数
摘要:应用统计学: s检验是检验否符合正态,而k-S检验是检验否符合一种分布。 已知分布便知道参数,知道参数不知道分布。 适应性检验 多项式分布的情况如下例: 二项分布是多项式分布一种情况,所以就是上式中只有两个概率 独立性检验:PAB=PAPB 其中,29.76由假设独立后比例算得。 格式: 是右尾检验
阅读全文
方差分析||MSA/MSE|
摘要:应用统计学-方差分析 数值型数据使用线性回归来研究因素对因变量的影响。类别型数据使用方差分析来研究因素对因变量的影响。方差分析是使用方差比MSA/MSE来检验均值是否全相等,即相等是H0假设,而不全相等是H1假设。自变量是因素,而因素取值是水平。比如,降水量是因素,降水量大、中和小是因素的三个水平。
阅读全文
连续型矫正|成组和配对|百分率资料的显著性检验|非参数检验
摘要:生物统计与实验设计 成组t检验是将所有对象的数据随机分为两组,两组之间具有方差齐性,但是实际情况是不能能保证所有对象是一样的,所以可以采用配对t检验,即成组是所有对象有一组数据,而配对t检验有两组数据。但是配对t检验对样本量要求大,所以实际问题要结合实验设计。 百分率资料的显著性检验的关键在于将二项
阅读全文
PP图|QQ图|正态性检验|K-S检验|S-W检验|
摘要:应用统计学: 物理条件一致时,有理由认为方差是一致的。配对检验可排除物理影响,使方差变小,但是自由度降低了,即样本数变小。二项分布均值假设检验的模型要依据前面的假设条件: PP图统计图要看中间的贴近情况 即先通过直方图得到PP-plot,通过散点图拟合一个线性直线,找该直线的截距和斜率,通过截距和斜
阅读全文
两类错误|β的变化|两个总体比较的假设检验|总体比例检验|一个总体比较的假设检验
摘要:应用统计学: 注意: 备择假设中不会有等号 就算是接受H0假设,也不能证明H0假设,此假设作用是拒绝H0假设从而接受H1假设,所以应该先写H1假设。 当真实值与估计值很相近时,β可以很大,图: 由上图推导可知n变大数据更集中于某值,则β也变小 假设检验整个过程就是:陈述H0H1假设,抽样后选择检验方
阅读全文
线性相关|回归分析|
摘要:生物统计学 相关与回归 描述和预测统计之后,相关与回归预测变量之间的关系。 相关关系是变量间关系不能用函数精确表达,即不一一对应而是点分布在直线周围。 评价指标是相关系数,有总体相关系数和样本相关系数,协方差的正负性与相关系数的正负性同步,当相关系数为0时虽然无线性相关,但是可能存在其他非线性关系:
阅读全文
重复测量的方差分析|Mauchly's Test of Sphericity|
摘要:生物统计学-重复测量的方差分析 之前的方差分析应用条件要求组之间是独立的,即某种因素下相同时段测量的结果数据,但4月与5月数据是有关系的,所以必须考虑某种因素下不同时段测量的结果数据,即使用重复测量的方差分析,即处理*基于时间因素的重复测量*同一时间下的重复测量。 这样的好处是克服时间效应,在样本数
阅读全文
方差分析|固定模型|随机模型|混合模型|SST|SST|SSE|LSD|SSR|单因素方差分析|双因素方差分析|无实验重复|有实验重复
摘要:方差分析 试验指标是观测值eg:降水量是试验因素,而降水量的多少是因素水平,试验处理必须是重复的,试验单位也应该是重复的。 固定模型是事先选择固定因素的固定水平;而随机模型是事先选择固定因素,但不确定因素水平,现在常用的是混合模型。 构架的数学关系是: 总体:观测数值=总体均值+处理效应+实验误差
阅读全文
独立两样本|边际误差|实验容量
摘要:应用统计学 独立样本:清华女生vs国科大女生 后面小样本验证正态的方法: 大样本将样本方差就认为是总体方差,与t分布无关。 前提条件:小样本两个独立样本,且都是正态总体。 标准差相同时,自由度直接相加,因为形状相同。 标准差不同时,则图像不能直接调成一种分布,所以要再调权重: 以上,标准差不同在计算
阅读全文
成组vs成对|H1是受保护的|U检验
摘要:生物统计与实验设计 样本均值的分布推导 概率密度曲线上每点x取值概率是不相等的。标准化是转化为无量纲的表面误差,该分布是误差分布,置信区间是可接受该误差是随机误差的误差区间。上面的部分是该估计参数与平均数的差,即表面差异,下边是标准差,标准差的量纲和表面差异量纲一致。 假设检验是支持H1假设的,H1
阅读全文
SPSS|Data|Transfer|Analysis|Label|One sample test|Testval|Criables|
摘要:生物统计与实验设计-使用SPSS Data用于整合;Transfer用于预处理;Analysis用于数据的二维呈现;Label是在报表中呈现的名字; 给离散值编码: 对于离散值做数学计算: 均值比较用于假设检验,可以使用描述统计找原始数据的问题。可以通过以下指标:看均值,方差,min,max,来检查
阅读全文
t分布|F分布|点估计与区间估计联系|
摘要:应用统计学 推断统计需要样本形容总体,就要有统计量。注意必须总体是正态分布,否则统计量的分布不能得到。卡方分布和t分布只要样本大于30都近似于正态分布。 t分布和F分布推导及应用(图): 总体比例是π,样本比例是p比例可用于计算患病率。近似就是均值和方差不发生改变,但是分布形式改变了,其实形状没发生
阅读全文
列表分析|卡方检验|适应性检验|独立性检验|
摘要:基于样本分布与理论分布之间的偏离程度构建统计量,得到一个统计量的抽样分布。 判断样本分布与理论分布之间的偏离程度是抽样误差还是实质性变化,具体而言就是样本值与理论值之间的差值是抽样误差造成的还是本身就这样。令样本统计量(O)与总体真值(E)之间的差值作为统计量,用平方(O-E)来表现样本分布与理论分
阅读全文
参数估计|无偏性|有效性|一致性|
摘要:生物统计学-参数估计 参数估计需要未知参数的估计量和一定置信度 估计方法:用点估计估计一个值;用区间估计估计值的可能区间和是该值的可能性。 对估计值的评价标准: 无偏性是估计量(不一定是样本均值)抽样分布的数学期望等与总体参数的真值。 有效是有时几组数据都是无偏的,但是此时有效数是方差最小的。 一致
阅读全文
两类错误
摘要:两类错误基于小概率事件仍可能发生,如下图所示: 例如:当H0成立时,p=0.03时,对于0.01来说,就是接受,此时正确概率为0.99;对于0.05就是拒绝,此时犯错误概率是0.05。 为什么α和β是此消彼长的关系???? 可以通过增大样本量减少一类二类错误,样本量不够要靠实验设计。
阅读全文