利用GCTA工具计算复杂性状/特征(Complex Trait)的遗传相关性(genetic correlation)

如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因组复杂性状分析”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性状/表型的遗传相关性。

一,在Linux上安装GCTA工具:

wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下载GCTA工具
unzip gcta_1.26.0.zip #解压GCTA工具

“wget -r -np -pk -nH -P”命令完全照搬,“./to/your/path/way/gcta”是指你想把GCTA软件下载在哪个路径,按个人需求适当修改。

二、准备PLINK二进制格式文件,比如 test.fam, test.bim test.bed 

三、生成 test.grm.bintest.grm.N.bintest.grm.id 格式文件

/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遗传相关性分析

“/gcta/gcta64”指GCTA软件的位置

“--make-grm”指生成 test.grm.bintest.grm.N.bin和test.grm.id 格式文件

“--out test”指输出的文件名为test

四、准备性状/表型文件,后缀为.txt格式,不需要表头,第一列为family ID, 第二列为individual ID 第三列和第四列为 phenotypes ,类似于PLINK的表型文件格式

五、计算遗传相关性

gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test

得到test.hsq 格式的文件

test.hsp文件内容如下:

Source Variance SE
V(G)_tr1 0.479647 0.179078  #trait 1 的遗传方差和标准误
V(G)_tr2 0.286330 0.181329   #trait 2 的遗传方差和标准误
C(G)_tr12 0.230828 0.147958  #trait 1 和 2 之间的遗传协方差和标准误
V(e)_tr1 0.524264 0.176650  #trait 1 的剩余方差和标准误
V(e)_tr2 0.734654 0.181146  #trait 2 的剩余方差和标准误
C(e)_tr12 0.404298 0.146863  #trait 1 和 2 的剩余协方差和标准误
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458  # 遗传相关性和标准误
n 3669  # 样本量

其中,rG即为我们想要的遗传相关性,0.622864 和 0.217458分别代表两个性状/表型间的遗传相关性(genetic correlation)和标准误(Stand error)

 

posted @ 2016-12-25 16:05  橙子牛奶糖  阅读(8470)  评论(44编辑  收藏  举报