近期接手一个chip-seq项目,在call出来peak之后,发现在可视化这一块对植物并不友好。对于动物来说,整套流程都是极其详细的,但是相对于植物,流程的各个部分都是零零散散的。在这里整合一下各路大神对于植物可视化的流程,方便植物领域的同行们参考。纯粹是一个生信小白的搬运工作,如果有侵权,请联系我,立删。
为什么不用chip-seek可视化网站?唉,没办法,网站对我不友好,提交不了任务。好,话不多说,分析开始,所有步骤都在R里面完成。
source ("https://bioconductor.org/biocLite.R")
biocLite("ChIPseeker")
biocLite("DO.db")
library("ChIPseeker")
以上为调用Y叔的chip-seeker包的步骤,若是动物,可直接调用txdb对象,植物的话,需要自己制作。接下来就是制作植物的txdb对象的方法,本方法参考另一位大神“https://www.jianshu.com/p/4a92ce5174fb”,可直接去搜索他的简书“灵动的小猪”,写的很详细,是玉米的,我用的水稻的,都是模式植物。
install.packages("BiocManager") #选择CRAN镜子时直接选第一个
BiocManager::install("GenomicFeatures", version = "3.8")
BiocManager::install("biomaRt", version = "3.8")
library("GenomicFeatures")
library("biomaRt")
listMarts()
listMarts(host = "http://plants.ensembl.org")
mart<-useMart(biomart = "plants_mart",host = "http://plants.ensembl.org")
datasets <- listDatasets(mart)
datasets$dataset #此步骤会出现植物品种列表,选择自己所需的即可
rice_txdb <- makeTxDbFromBiomart(biomart = "plants_mart",dataset = "osativa_eg_gene",host = "http://plants.ensembl.org")
saveDb(rice_txdb, file="rice_2019_07.sqlite")
上面的一步步来,就把对象建好了。最后txdb文件被命名为了“rice_2019_07.sqlite”,保存在了当前的工作目录下。若是想知道每步具体啥意思,可以去大神的简书里看。
以上步骤是第一次用的时候需要做的,若是第二次用的时候,只需要调用两个包就好了,如下:
library("ChIPseeker")
library("GenomicFeatures")
rice_txdb <- loadDb("rice_2019_07.sqlite") #调用你建好的txdb对象
然后就是激动人心的时候,该步骤参考Y叔写的“chip-seq数据分析大礼包”,记得去关注Y叔的公众号biobabble,绝对的大神
H3K27ac <- readPeakFile("H3K27ac_peaks.narrowPeak")
covplot(H3K27ac,weightCol=5) #所有染色体上峰值分布图
covplot(H3K27ac, weightCol=5, chrs=c("Chr4","Chr6", "Chr5")) #部分染色体
接下来是peak的注释,最好自己下载注释文件来制作txdb对象,快速便捷
rice_anno_txdb <- makeTxDbFromGFF("Oryza_sativa.IRGSP-1.0.44.chr.gff3.gz") #自行下载注释的文件。推荐ensemblplants
peakAnno <- annotatePeak(H3K27ac, tssRegion=c(-3000, 3000),TxDb=rice_txdb, annoDb="rice_anno_txdb") #报错信息我直接忽视了
plotAnnoPie(peakAnno)
plotAnnoBar(peakAnno)
vennpie(peakAnno)
upsetplot(peakAnno)
以上就是peak及peak注释可视化,是不是很方便?具体啥意思或者想要其他图片可以直接关注Y叔公众号去找到该包。
按照上述流程完全可以跑通,该流程适用于植物的chip-seq数据可视化,网上的很多流程包含了一些容易出错的和容易把人绕晕的步骤,已尽量避开。
生信小白,努力学习中,写的不对的地方请指出,欢迎多交流!
网友评论