随笔分类 - Statics
摘要:理解皮尔逊相关的两个角度其一, 按照高中数学水平来理解, 皮尔逊相关(Pearson Correlation Coefficient)很简单, 可以看做将两组数据首先做Z分数处理之后, 然后两组数据的乘积和除以样本数Z分数一般代表正态分布中, 数据偏离中心点的距离.等于变量减掉平均数再除以标准差.(...
阅读全文
摘要:相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:(1)、当相关系数为0时,X和Y两变量无关系。(2)、当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。(3)、当X的值增大(减...
阅读全文
摘要:http://baike.baidu.com/view/852140.htm?fr=aladdinhttp://baike.baidu.com/link?url=dRHhreYsYLHNBYIb8GA5wQjG5hLQqXMDhIw7hPYgMpNG4bJMSxfbQ7gY9NR-4VSjQp_jq...
阅读全文
摘要:Bonferroni校正:如果在同一数据集上同时检验n个独立的假设,那么用于每一假设的统计显著水平,应为仅检验一个假设时的显著水平的1/nhttp://baike.baidu.com/view/1217813.htm?fr=aladdinBonferroni校正法: 此方法是在进行两两比较时对检验水...
阅读全文
摘要:一、缺失值产生的原因缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器损坏,机械故障导致某段时间数据未能收集(对于定时数据采集而言)。人为原因是由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,比如,在...
阅读全文
摘要:波达计数法(Borda Count)是较为简单的排序投票法,每个选项借由选票上的排序来取得积分,积分最高者获胜。另一个类似的方法则是位置投票制。投票人按喜好排列候选者。如果候选者在选票的排第一位,它就得某个分数;排第二位得一个较小的分数……如此类推。分数累计下来最高分的候选者便取胜。名字的由来:历史...
阅读全文
摘要:1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的...
阅读全文
摘要:Cochran-Armitage trend test是我们常说的趋势卡方检验,一般是针对基因型的2*3列联表的。譬如说三种基因型,如果按照某一个allele来看,可以有0、1、2个拷贝,是有序的,我们要观察随着allele数目的增多,发病的比例是否有差异,那么就要用Trend test。而Pear...
阅读全文

浙公网安备 33010602011771号