美文网首页
2020-12-04

2020-12-04

作者: 果果爸_2019 | 来源:发表于2020-12-04 15:05 被阅读0次

自己的代码记录
illunima 芯片数据注释(ID转换):

##ID 转换
library(idmap1)
ids=getIDs('GPL10558')
head(ids)

probe2symbol = ids[,1:2]
head(probe2symbol)
colnames(probe2symbol) <- c("probeset","symbol")
library(dplyr)
library(tibble)
exprSet <- data.frame(exprSet) %>% 
  rownames_to_column(var="probeset") %>% 
  #合并探针的信息
  inner_join(probe2symbol,by="probeset") %>% 
  #去掉多余信息
  select(-probeset) %>% 
  #重新排列
  select(symbol,everything()) %>% 
  #求出平均数(这边的点号代表上一步产出的数据)
  mutate(rowMean =rowMeans(.[grep("GSM", names(.))])) %>% 
  #去除symbol中的NA
  filter(symbol != "NA") %>% 
  #把表达量的平均值按从大到小排序
  arrange(desc(rowMean)) %>% 
  # symbol留下第一个
  distinct(symbol,.keep_all = T) %>% 
  #反向选择去除rowMean这一列
  select(-rowMean) %>% 
  # 列名变成行名
  column_to_rownames(var = "symbol")


save(exprSet,pdata,file = "GSE130404.Rdata")

相关文章

网友评论

      本文标题:2020-12-04

      本文链接:https://www.haomeiwen.com/subject/mqhiwktx.html