deeptools可视化

作者: 苏牧传媒 | 来源:发表于2018-11-29 00:14 被阅读130次

    ref1:deeptools辅助CHIP-seq数据分析-可视化 | 生信菜鸟团

    ref2:如何使用deeptools处理BAM数据 - 生信技能树

    ref3:The tools — deepTools 3.1.3 documentation

    第一个功能,把bam文件转换为bw格式文件:

    bamCoverage -b tmp.sorted.bam -o tmp.bw

    peak分布可视化

    为了统计全基因组范围的peak在基因特征的分布情况,需要用到computeMatrix计算,用plotHeatmap以热图的方式对覆盖进行可视化,用plotProfile以折线图的方式展示覆盖情况。

    computeMatrix具有两个模式:scale-region和reference-point。前者用来信号在一个区域内分布,后者查看信号相对于某一个点的分布情况。

    computeMatrix scale-regions -b 3000 -a 3000 --regionBodyLength 5000-p 25 \

    -R mm10_Gencode_VM18.bed \

    -S *.bw \

    --skipZeros \

    --outFileName matrix.gz

    结果可视化

    可视化的方法有两种,一种是轮廓图,一种是热图。两则都提供了足够多的参数对结果进行细节上的修改。

    plotProfile -m matrix.gz \              

    -out plotProfile.png \              

    --numPlotsPerRow 2 \              

    --plotTitle "profile"

    --numPlotsPerRow NUMPLOTSPERROW :  Number of plots per row (default: 8)

    ##########################################################

    plotHeatmap \

    -m matrix.gz \      

    -out plotHeatmap.png \

    --plotTitle "Heatmap"

    构建bed:

    安装:

    sudo apt install bedops

    命令:

    1.先下载TAIR10_GFF3_genes.gff3, 

    2. 然后convert2bed --input=gff [--output=bed] <TAIR10_GFF3_genes.gff> TAIR10_GFF3_genes.bed

    3. 但是,computeMatrix 识别的bed文件只要前三列

    cut -f 1-3 TAIR10_GFF3_genes.bed > ref.bed

    4. 再跑computeMatrix就可以了

    我用的Rseqc的bed

    相关文章

      网友评论

        本文标题:deeptools可视化

        本文链接:https://www.haomeiwen.com/subject/kngtcqtx.html