今天学习了使用R语言从UCSC XENA 数据库下载GTEX数据的方法(ps:打不开GETX网站,郁闷!只能曲线救国了。)
废话不多说,直接代码走起!
###下载数据 GTEx网站打不开,试一试UCSCXenaTools包下载GTEx数据
options(use_hiplot = TRUE) #xena上海镜像站点,在query数据前加载提速下载
#加载包
library(UCSCXenaTools)
library(dplyr)
# 加载Xenadata数据集,查看能够下载的各种数据
data(XenaData)
View(XenaData)
head(XenaData) #搜索得知GTEx属于toilHub
#generate, filter,开始第一步产生过滤
UCSCXenaTools:::.xena_hosts #XenaHostNames对象名字通过该函数获得
XenaGenerate(subset = XenaHostNames=="toilHub") %>% #产生一个XenaHub对象,datasets,cohorts,hosts查看XenaHub对象各部分内容
XenaFilter(filterCohorts = "^GTEX$") %>%
XenaFilter(filterDatasets = "gtex_gene_expected_count") -> df_todo
df_todo
# query, download 询问下载
destdir = "./TCGAdata/" #设置下载文件所在位置
XenaQuery(df_todo) %>%
XenaDownload(destdir = destdir,trans_slash = TRUE,force = T) -> xe_download
#最后 prepare
GTEx<- XenaPrepare(xe_download)
save(GTEx,file="gtex_gene_expected_count.Rdata")
哈,可能由于镜像所在地(sh)现状影响,镜像暂时无法使用!
另外,这个包不支持断点下载! 我去洗个澡的功夫,电脑息屏,下载不完整了,只能重来了。。。。 具体结果等我再次下载完,prepare后揭晓!
网友评论