美文网首页
生信地基系列--Bioconductor 中的注释包

生信地基系列--Bioconductor 中的注释包

作者: 可能性之兽 | 来源:发表于2022-11-09 13:23 被阅读0次
    image.png

    Bioconductor 中有三种主要的注释类型:

    • Gene centric (以基因为中心)AnnotationDb packages:
      • Organism level: e.g. org.Mm.eg.db.
      • 生物体水平: 例如 org.MM.eg.db。
      • Platform level: e.g. hgu133plus2.db, hgu133plus2.probes, hgu133plus2.cdf.
      • 平台级别: 例如 hgu133plus2.db、 hgu133plus2.properties、 hgu133plus2.cdf。
      • Homology level: e.g. hom.Dm.inp.db.
      • 同源级别: 例如 hom.Dm.inp.db。
      • System-biology level: e.g. GO.db.
      • 系统生物学水平: 例如 GO.db
    • Genome centric (以基因组为中心)GenomicFeatures packages include:
      • Transcriptome level: e.g. TxDb.Hsapiens.UCSC.hg19.knownGene, EnsDb.Hsapiens.v75.
      • 转录组水平: 例如 TxDb. Hsapiens.UCSC.hg19.known Gene,EnsDb. Hsapiens.v75。
      • Generic genome feature: can generate via GenomicFeatures.
      • 通用基因组特征: 可以通过基因组特征生成。
    • One web-based resource accesss (一个基于网络的资源访问) via biomaRt package:
      • Query web-based ‘biomart’ resource for genes, sequence, SNPs, and etc.
      • 查询基于网络的“‘biomart’”资源,包括基因、序列、 SNP 等。

    使用 AnotationDb 对象

    AnnotationDb 是所有注释包的虚拟基类。它包含一个数据库连接,并且意味着是 Bioiconductor 注释包中一组类的父类。这些类将为广泛可用的选择方法集提供一种分派手段,从而允许从注释包中轻松提取数据。
    所有基于 AnnotationDb 对象的注释包都公开一个名称与包本身完全相同的对象。

    select,columnskeys一起用于从AnnotationDb对象(或从该类派生的任何对象,如ChipDb,OrgDb,GODb,InparanoidDb,ReactomeDb 等)中提取数据:

    (x 代表一个 AnotationDb 对象)

    • columns(x):显示返回哪些类型的数据。

    • keytypes(x):允许用户输入哪些数据类型,有哪些 keytypes 可以用作 select 或 keys 的 keytypes 参数

    keys(x, keytype, …):返回包含在AnnotationDb对象中的数据库的键。

    • select(x, keys, columns, keytype, ...):基于 keys, columns 和 keytype 以 data.frame 数据类型返回数据,可以是一对多的关系。

    • mapIds(x, keys, column, keytype, …, multiVals):获取一组具有特定键类型的键的映射 ID(列)。通常作为命名字符向量、列表甚至 SimpleCharacterList 返回。

    • SaveDb 将获取一个 AnnotationDb 对象,并将数据库保存到由传递到 file 参数的路径指定的文件中

    • LoadDb 需要一个Sqlite 数据库文件作为参数,并使用该文件的元数据表中的数据返回适当类型的 AnnotationDb 样式对象。

    library(org.Hs.eg.db)
    class(org.Hs.eg.db)
    

    GO.Db 和 org.Hs.eg.db 是 GO 注释的副本。GO.db 每6个月更新一次,每次更新一次 Bioiconductor。同时还使用 GO.db 更新 org.Hs.eg.db。BioMaRt 连接到存储信息的服务器,因此它将是最新的。如果你想要一个稳定的版本,你可以使用 GO.db 或 org.Hs.eg.db,如果你想要最新的(从昨天开始)数据,每次你做分析的时候,你可以使用 biomaRt。

    Understand Bioconductor Annotation Packages | Yiwei Niu's Note

    Bioconductor - 3.16 AnnotationData Packages
    Genomic Annotation Resources (bioconductor.org)

    相关文章

      网友评论

          本文标题:生信地基系列--Bioconductor 中的注释包

          本文链接:https://www.haomeiwen.com/subject/naxgtdtx.html