1.下载
library(withr)
with_makevars(c(PKG_CFLAGS = "-std=c11"),install_github("MRCIEU/TwoSampleMR"))
library(TwoSampleMR)
2.读取暴露文件
2.1 使用TwoSampleMR获取MR base提供的数据
(要求网络状态良好,并且需要提前知道暴露的ID号,以体质指数为例,该暴露号为‘ieu-a-2’)
bmi <-extract_instruments(outcomes='ieu-a-2',access_token = NULL) #获取暴露数据
head(bmi) #查看暴露数据
extract_instruments:此功能针对指定的结果集搜索GWAS重要SNP(对于给定的p值)。 然后,它执行基于LD的聚集以仅返回独立的重要关联
关于extract_instruments()的使用,有几个参数需要大家注意一下:
(1)第一个就是access_token这个参数,对于中国大陆地区的用户必须设置该参数为access_token=NULL,这样才能顺利获取数据,否则就需要开VPN获取谷歌授权。
(2)第二个是参数p1,它是用来指定暴露中SNP的p值的,它的默认值是p1=5e-8,因此只有p值小于5e-8的SNP才会提取出来。当然如果没有SNP小于5e-8的话,我们通常可以设置p1=1e-5,不过这个时候就需要认真评估弱工具变量偏倚了。
(3)第三个重要参数是clump以及与之相关的r2和kb,clump是一个逻辑型参数,只有clump=TRUE和clump=FALSE这两种情况。如果选择了参数值为clump=FALSE的话,那么r2和kb这两个参数就无效了,也即先不去除含有连锁不平衡的SNP。当clump=TRUE时,我们可以用r2和kb来确定去除连锁不平衡SNP的条件,具体内容我会在下期内容中进行详细讲解。默认情况下是clump=TRUE,r2=0.001和kb=10000
2.2 使用TwoSampleMR包读取本地文件
exp_dat <- read_exposure_data(
filename = 'MICAD_gwas.txt',
clump = FALSE,
sep= "\t",
snp_col = "SNPID",
beta_col = "log_OR",
se_col = "se",
effect_allele_col ="effect_allele",
other_allele_col = "other_allele",
eaf_col = "effect_allele_freq",
pval_col = "Pvalue"
)
head(exp_dat)
网友评论