简介
Bioconductor提供了某些物种的全基因组序列数据包,这些数据包是基于Biostrings构建的,称为BSgenome数据包。BSgenome数据包内包含的序列为DNAString,DNAStringSet或MaskedDNAString对象。使用Biostrings包处理数据包。
安装查看
# 安装
BiocManager::install("BSgenome")
# 查看包含的BSgenome数据包
(aag <- available.genomes())
# 遭到果蝇的BSgenome数据包
dag <- aag %>% grep("Dmelanogaster",.)
aag[dag]
# 安装果蝇BSgenome数据包
BiocManager::install("BSgenome.Dmelanogaster.UCSC.dm6")
读取指定数据
library("BSgenome.Dmelanogaster.UCSC.dm6")
Dmelanogaster
BSgenome.Dmelanogaster.UCSC.dm6 #同上
# 数据包内的序列名称
seqnames(BSgenome.Dmelanogaster.UCSC.dm6)
seqinfo(BSgenome.Dmelanogaster.UCSC.dm6)
网友评论