GWAS分析
一、plink 下的操作
数据map 和ped 文件:
MAP files:
如图:四列,分别是染色体编号、rs或者snp标识、Genetic distance、bp position(bp)
PED files:
如图:六列,Family ID、Individual ID、Paternal ID、Maternal ID、Sex、Phenotype。
注意:sex(1=male,2=female)但是
转换为tped 和tfam 文件:
xx:map或者ped 文件名,不需要后缀
out:输出的tpe 或tfam 文件名
如图:
tped:
tfam:
二、R下利用GenABEL包的操作
1. library(GenABEL)需要一些其他的包的支持,提示缺哪个包就安装哪个包。
2. 利用convert.snp.tped函数对这两个tped和tfam文件进行合并
生成gen2.raw文件如图:
3. 联合表型数据和snp基因数据
其中的pheno.dat是根据表型文件写入到R在保存出来的,其中表型中的id一定要和tfam中的id保持一致(数量上一致,且数值一致)其实也就是和gen2.raw中的第二行数据中的id一致。Pheno.dat:
这里有个细节就是id必须是字符型的。
所以pheno.dat的获得:
这样生成了关键的gwaa.data类的文件:HS_F5.raw
里面有些其他属性函数,nids nsps 等等,
具体含义可以参考下此包的说明书的第四章。
具体的话,在你下载了包后,解压出来有个doc文件夹,就在里面有个pdf文档,其实前面的几章节也可以看看,讲genetics包的,告诉你怎么下载相关文件,还挺好的。
也不知道写到哪里了,先上传这么多吧。
后期还有画曼哈顿图的一些代码,需要的可以找我。