此文为本菜鸟初学笔记记录,多数来自大神们的方法,大神实在多,奈何我太菜,而且还记不住啊!
方法一:由于GPL平台探针通常很大,所以下载对网络速度的要求挺高的,网络好的可以用这个的,毕竟我的半天都只有几十兆,还存在没下载完全的风险,所以并没有等到下载完整的探针数据。
library(Biobase)
#下载GPL570 file, 并加载到当前环境中。
gpl <- getGEO('GPL570', destdir=".")
colnames(Table(gpl))
head(Table(gpl)[,c(1,11,12)]) ##确定需要的列
probe2symbol<-Table(gpl)[,c(1,11)]
expreset<- merge(exp, probe2symbol, by.x = "ID_REF", by.y = "ID")
# 根据exp中的ID_REF这列,和probe2symbol的ID这一列来合并
方法二:
#安装Jimmy总结的网站中对应的R包(http://www.bio-info-trainee.com/1399.html),下面为下载GPL570的探针
BiocManager::install("hgu133plus2.db")
library(hgu133plus2.db)
ls('package:hgu133plus2.db')#查看hgu133plus2.db有多少个对象
#找到我们需要的hgu133plus2SYMBOL
ids <- toTable(hgu133plus2SYMBOL)#totable获得对应关系
#探针对应到基因
expreset<- merge(ids, exp3, by.x = "probe_id", by.y = "probe")
head(expreset)
library(dplyr)
expreset1<-expreset %>% distinct(symbol, .keep_all = T)#按照列删除重复项
write.csv(expreset1,"gse46234.csv")
网友评论