美文网首页生信绘图
基因组浏览器、BAM文件可视化工具(2)--- IGV

基因组浏览器、BAM文件可视化工具(2)--- IGV

作者: 笺牒九州的怪咖 | 来源:发表于2020-07-13 20:25 被阅读0次

    整合基因组浏览器(IGV)是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据。它支持各种数据类型,包括array-based的和下一代测序的数据和基因注释。IGV这个工具很牛,发了NB:

    James T. Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S. Lander, Gad Getz, Jill P. Mesirov. Integrative Genomics Viewer. Nature Biotechnology 29, 24–26 (2011)

    使用IGV的基本思路

    1)安装和配置

    要用linux上的IGV(首先需要去官网下载一个Linux下的IGV),然后需要一个远程控制工具:

    这里使用 VNC,网上下载破解版,安装(输入注册码即可破解,文章底部有注册码)。

    2)运行IGV

    开启 linux 的 VNCserver,开启了之后,linux上会显示节点和端口,用于Windows端的连接。

    vncserver -geometry 1366x768  #调节分辨率 

    开启服务后,Linux会提示可以登录的节点,登录VNC需要你的ip、端口及VNC密码。

     运行 VNC 客户端(VNC viewer)里的 IGV.sh 开启可视化程序(打开Windows的VNC会自动跳转到Linux下的IGV安装目录,双击IGV.sh即可打开)。

    1.载入参考基因组数据

    可以点击选择一个,也可以通过菜单栏Genomes载入文件。

    2.载入排序后的bam文件

    通过菜单栏的File,load from file。。。

    3)IGV可视化数据准备

    不是什么数据都可以拿IGV看的,参考基因组必须为FASTA格式;

    IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads;

    需要将待比对的reads与前面指定的参考基因组用bwa进行比对; 

    比对后的sam文件也不能直接载入(麻烦),要转bam;bam排序;bam建索引(可以一步完成);

    命令流程如下:

    BWA出来的sam文件无法直接被 IGV 利用的,必须经过 samtools 处理后才能被 IGV 显示出来。

    ##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    samtools view -@ 10 -bS -F 4 ./contigs_sequence_align_to_public_genome.sam > ./contigs_sequence_align_to_public_genome.bam

    samtools sort -@ 10 ./contigs_sequence_align_to_public_genome.bam contigs_sequence_align_to_public_genome.sorted

    samtools index contigs_sequence_align_to_public_genome.sorted.bam contigs_sequence_align_to_public_genome.sorted.bai

    samtools depth contigs_sequence_align_to_public_genome.sorted.bam >depth_reads.txt

    wc -l depth_reads.txt > Coverage-aln_reads.txt

    ##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    更多的使用细节参照samtools 使用方法

    IGV 需要设置内存,在看大型基因组时很吃内存.

    示例:

    下面显示的是组装异常区,这是手动连接的地方,Pacbio全部不能顺利跨过去,说明组装有问题。

     以下是单细胞转录组比对可视化:

    4)IGV用户指南

    目录:http://software.broadinstitute.org/software/igv/UserGuide

    5)用户界面

                                                 Main Window(主窗口)

    1.tool bar(工具栏),menu bar(菜单栏),pop-up menus(弹出式菜单)。

    2.染色体上的红色盒子表示显示这部分染色体,显示完整染色体是红框会消失。

    3.尺度显示了染色体的可见部分,刻度线显示了染色体的位置,跨度列表显示了当前显示的碱基的数量。

    4.IGV在水平行显示的数据称为tracks。通常,每个tracks代表一个样本或实验。这个例子展示了甲基化、基因表达、拷贝数,LOH和突变数据。

    5.IGV也显示某些特性,比如在tracks中的基因。默认情况下,IGV在一个面板显示数据,在另一个面板显示数据特性。拖放一个track名称,将一个track从一个面板移动到另一个地方。

    6.Track名称列在最左边面板。名字的易读性取决于 tracks的高度,例如,track越小,它的名字的可读性越小。

    7.属性名称被列在顶部的属性面板。彩色块代表属性值,每个独特的值被都有一个独特的颜色。鼠标放在一个颜色块的附近来查看其属性值。

    ------------------------------------------------------------------------------------I am a line !----------------------------------------------------------------------------------------------------------

    转载链接地址:https://www.cnblogs.com/leezx/p/5603481.html

    相关文章

      网友评论

        本文标题:基因组浏览器、BAM文件可视化工具(2)--- IGV

        本文链接:https://www.haomeiwen.com/subject/repzcktx.html