[R]生物信息各类ID转换攻略

作者: 郑宝童 | 来源:发表于2018-11-03 15:16 被阅读21次

    前几天,一位小师妹问了我,ID转换的相关问题。确实,生物信息学经常会碰到ID转化,转换的方法有很多,接下来我将列举我所知晓的几个ID转换方法。

    一、网站类

    二、软件类

    生信人开发的小工具sangerbox,其中有个便捷ID转换工具

    image.png
    使用方法可以查看ID便捷转换工具使用教程
    image.png

    三、R代码转换

    示例:将表达谱geneexp中的symbol,替换成gene id

    #加载包
    library(AnnotationDbi)
    library(org.Hs.eg.db)
    
    #转换示例代码
    genesymbol<-as.character(row.names(geneexp))
    #获取两列的对应关系
    annoutu13<-select(org.Hs.eg.db,keys = genesymbol,columns ="ENTREZID",keytype = "SYMBOL")
    gzsindex<-match(genesymbol,annoutu13$SYMBOL)
    geneid<-annoutu13$ENTREZID[gzsindex]
    #获取匹配为空的位置,并删除对应行
    quNAindex<-which(is.na(geneid))
    geneexp<-geneexp[-quNAindex,]
    geneid<-geneid[-quNAindex]
    table(duplicated(geneid))
    row.names(geneexp)<-geneid
    

    嘿嘿,上面的代码其实支持很多类型的ID转换,我们用keytypes函数看看支持什么ID转换。

    image.png

    你也可以参看生信菜鸟团gene的各种ID转换终结者-bioconductor系列包生信技能树:ID转换大全来了解更多的ID转换。

    相关文章

      网友评论

        本文标题:[R]生物信息各类ID转换攻略

        本文链接:https://www.haomeiwen.com/subject/blpkxqtx.html