标签:方差 color txt round 安装 不同 二进制格式 rem trait
如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因组复杂性状分析”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性状/表型的遗传相关性。
一,在Linux上安装GCTA工具:
wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下载GCTA工具 unzip gcta_1.26.0.zip #解压GCTA工具
二、准备PLINK二进制格式文件,比如 test.fam, test.bim 和 test.bed
三、生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遗传相关性分析
四、准备性状/表型文件,后缀为.txt格式,不需要title,第一列为family ID, 第二列为individual ID 第三列和第四列为 phenotypes ,类似于PLINK的表型文件格式
五、计算遗传相关性
gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test
得到test.hsq 格式的文件
test.hsp文件内容如下:
Source Variance SE
V(G)_tr1 0.479647 0.179078 #trait 1 的遗传方差和标准误
V(G)_tr2 0.286330 0.181329 #trait 2 的遗传方差和标准误
C(G)_tr12 0.230828 0.147958 #trait 1 和 2 之间的遗传协方差和标准误
V(e)_tr1 0.524264 0.176650 #trait 1 的剩余方差和标准误
V(e)_tr2 0.734654 0.181146 #trait 2 的剩余方差和标准误
C(e)_tr12 0.404298 0.146863 #trait 1 和 2 的剩余协方差和标准误
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458 # 遗传相关性和标准误
n 3669 # 样本量
其中,rG即为我们想要的遗传相关性,0.622864 和 0.217458分别代表两个性状/表型间的遗传相关性(genetic correlation)和标准误(Stand error)
利用GCTA工具计算复杂性状/特征(Complex Trait)的遗传相关性(genetic correlation)
标签:方差 color txt round 安装 不同 二进制格式 rem trait
原文地址:http://www.cnblogs.com/chenwenyan/p/6219749.html