Loading

相关系数类问题的操作步骤

 1、绘制散点图

 2、进行正态JB分布检验。(大样本检验n>30)

 

 

代码如下

% 用循环检验所有列的数据
n_c = size(Test,2);  % number of column 数据的列数
H = zeros(1,6);  % 初始化节省时间和消耗
P = zeros(1,6);
for i = 1:n_c
    [h,p] = jbtest(Test(:,i),0.05);
    H(i)=h;
    P(i)=p;
end
disp(H)
disp(P)

原假设各指标均服从正态分布,在95%的置信水平,判断各指标的值是否小于1,且p值大于0.05,则服从原假设

小样本体验Shapiro-wilk检验

 

数据过大则用Q-Q图

要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点 是否近似地在一条直线附近。(要求数据量非常大)

 

 

3、判断出用那种相关系数,再绘制各指标数间的相关系数和显著性检验结果

斯皮尔曼相关系数和皮尔逊相关系数选择:

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用 spearman相关系数也可以, 就是效率没有pearson相关系数高。

2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。

3.两个定序数据之间也用spearman相关系数,不能用pearson相关系数。

定序数据是指仅仅反映观测对象等级、顺序关系的数据,是由定序尺度计量 形成的,表现为类别,可以进行排序,属于品质数据。

例如:优、良、差;

我们可以用1表示差、2表示良、3表示优,但请注意,用2除以1得出的2并不 代表任何含义。定序数据最重要的意义代表了一组数据中的某种逻辑顺序。

posted @ 2021-09-02 16:00  ⭐⭐-fighting⭐⭐  阅读(294)  评论(0)    收藏  举报