美文网首页CHIP分析组学生物信息可视化
【三维基因组】多组学可视化之washU

【三维基因组】多组学可视化之washU

作者: XuningFan | 来源:发表于2020-04-17 22:58 被阅读0次

    说到三维基因组可视化,就不得不说一下washU(http://epigenomegateway.wustl.edu/)了。washU相当于IGV的升级版,一向被三维基因组CNS级别的文章所钟情,能够产生极其fancy的效果,是三维基因的可视化神器。

    washU 目前支持包括人,小鼠,黑猩猩,斑马鱼等一系列物种。如下图所示。

    你可以选择你需要的基因和版本进行可视化分析。

    在选取了基因组版本号之后,你可以在搜索🔍框中,选择你所关注的基因或者SNP(如下图):

    输入关注的基因 输入关注的snp

    在选择完了关注的位点之后,你就可以通过view Local Tracks 导入你本地的文件。

    washU 支持的文件包括bigwig,bed,bam等等(如下所示)。

    像bam,bigwig,bed文件可以导入washU,以峰图的形式呈现。

    那么如何导入呢?有两种方式,一方面是刚刚所说的 本地上传 ,另一方面是通过URL提供数据,如下图:

    知道了数据类型和数据的上传方式,那么我们如何准备数据呢?

    首先看bed文件(如下图):

    包括4列: chr ,start,end ,value(如下图)

    处理命令如下:

    sort -k1,1 -k2,2n track.bedgraph > track.bedgraph.sorted  #对bedgraph进行排序bgzip  track.bedgraph.sorted  # 对bedgraph进行压缩

    tabix -p bed track.bedgraph.sorted.gz  #对压缩后的bedgraph 建立索

    bgzip安装如下:

    wget https://github.com/samtools/bcftools/releases/download/1.2/bcftools-1.2.tar.bz2 

    tar xvf bcftools-1.2.tar.bz2

    cd bcftools-1.2

    makemake install

    samtools sort test.bam > test.sorted.bam                    

       samtools  index test.sorted.bam

    bam文件有两种显示方式,一方面是显示每条reads 的信息,另一方面是显示峰图。

    bam文件必须先sort再导入washU。

    甲基化数据也可以用washU来展示(如下图所示)

    甲基化数据格式如下:

    第一到三列代表甲基化位点的position

    第四列代表甲基化的类型

    第五列代表甲基化水平

    第六列代表 正负链

    第七列代表位点的覆盖深度

    Hi-C数据可视化主要分为两种,一种是loop结构,一种是三角热图。其中三角热图数据采用.hic 文件格式。

    .hic 文件主要是Juicer 产生的文件格式。

    longrange

    The longrange track is a bed format-like file type. Each row contains columns from left to right: chromosome, start position (0-based), and end position (not included), interaction target in this format chr2:333-444,55. As an example, interval “chr1:111-222” interacts with interval “chr2:333-444” on a score of 55, we will use following two lines to represent this interaction:

    第一列: loop 左端的染色体编号

    第二列:loop左端的起始位置

    第三列:loop左端的终止位置

    第四列:loop右端的位置以及交互数值。

    此外,washU还支持calling card track 格式如下:

    那么针对以上文件总结而言:

    bgzip track.bedgraph.sorted 

    tabix -p bed track.bedgraph.sorted.gz

    针对bedgraph文件都要用bgzip压缩并建立索引。

    那么最后举个例子,在导入longrange,以及bam或者bigwig,我们基本就有了下面这张类似与文献里的图。

    相关文章

      网友评论

        本文标题:【三维基因组】多组学可视化之washU

        本文链接:https://www.haomeiwen.com/subject/loeuvhtx.html