1、安装
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("biomaRt")
2、数据处理
library(biomaRt)
##显示数据库,自己选择一个。一般选择第一个ENSEMBL_MART_ENSEMBL
listMarts()
##选择mart和database
mymart <- useMart("ENSEMBL_MART_ENSEMBL")
##在ensembl数据库中包含了很多数据集,代码查看。
ensemble_sets <- listDatasets(mymart)
##从多个数据集中选择一个数据集,做人当然选择人类基因的ensembl数据集。
mydat <- useDatasets("hsapiens_gene_ensembl", mart = mymart)
3、自己需要转换的数据导入并完成转换
##分别查看下你的这个database里面都有些什么信息。
listAttributes(dat)
listFilters(dat)
##然后利用getBM()函数获取注释
##假设这是你要转换的数据
my_ensembl <-c("ENSG00000242268","ENSG00000270112","ENSG00000167578")
my_symbols<- getBM(attributes=c("ensembl_gene_id","chromosome_name",
+ "hgnc_symbol"),
+ filters = "ensembl_gene_id",
+ values = my_ensembl,
+ mart = dat)
##保存一下结果。
write.csv(.....)
备注:
getBM()函数有4个参数:
attributers() 里面的值为我们想要输出的ID类型
filters() 里面的值为我们输入的ID类型
values = 这就是我们要输入的数据
mart= 这是我们所选定的数据库的基因组
好啦,搞定。
网友评论