整合基因组浏览器(IGV)是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据。它支持各种数据类型,包括array-based的和下一代测序的数据和基因注释。IGV这个工具很牛,发了NB:
使用IGV的基本思路
1)安装和配置
要用linux上的IGV(首先需要去官网下载一个Linux下的IGV),然后需要一个远程控制工具:
这里使用 VNC,网上下载破解版,安装(输入注册码即可破解,文章底部有注册码)。
2)运行IGV
开启 linux 的 VNCserver,开启了之后,linux上会显示节点和端口,用于Windows端的连接。
vncserver -geometry 1366x768 #调节分辨率
开启服务后,Linux会提示可以登录的节点,登录VNC需要你的ip、端口及VNC密码。
运行 VNC 客户端(VNC viewer)里的 IGV.sh 开启可视化程序(打开Windows的VNC会自动跳转到Linux下的IGV安装目录,双击IGV.sh即可打开)。
1.载入参考基因组数据
可以点击选择一个,也可以通过菜单栏Genomes载入文件。
2.载入排序后的bam文件
通过菜单栏的File,load from file。。。
3)IGV可视化数据准备
不是什么数据都可以拿IGV看的,参考基因组必须为FASTA格式;
IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads;
需要将待比对的reads与前面指定的参考基因组用bwa进行比对;
比对后的sam文件也不能直接载入(麻烦),要转bam;bam排序;bam建索引(可以一步完成);
命令流程如下:
BWA出来的sam文件无法直接被 IGV 利用的,必须经过 samtools 处理后才能被 IGV 显示出来。
##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
samtools view -@ 10 -bS -F 4 ./contigs_sequence_align_to_public_genome.sam > ./contigs_sequence_align_to_public_genome.bam
samtools sort -@ 10 ./contigs_sequence_align_to_public_genome.bam contigs_sequence_align_to_public_genome.sorted
samtools index contigs_sequence_align_to_public_genome.sorted.bam contigs_sequence_align_to_public_genome.sorted.bai
samtools depth contigs_sequence_align_to_public_genome.sorted.bam >depth_reads.txt
wc -l depth_reads.txt > Coverage-aln_reads.txt
##-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
更多的使用细节参照samtools 使用方法。
IGV 需要设置内存,在看大型基因组时很吃内存.
示例:
下面显示的是组装异常区,这是手动连接的地方,Pacbio全部不能顺利跨过去,说明组装有问题。
以下是单细胞转录组比对可视化:
4)IGV用户指南
目录:http://software.broadinstitute.org/software/igv/UserGuide
5)用户界面
Main Window(主窗口)
1.tool bar(工具栏),menu bar(菜单栏),pop-up menus(弹出式菜单)。
2.染色体上的红色盒子表示显示这部分染色体,显示完整染色体是红框会消失。
3.尺度显示了染色体的可见部分,刻度线显示了染色体的位置,跨度列表显示了当前显示的碱基的数量。
4.IGV在水平行显示的数据称为tracks。通常,每个tracks代表一个样本或实验。这个例子展示了甲基化、基因表达、拷贝数,LOH和突变数据。
5.IGV也显示某些特性,比如在tracks中的基因。默认情况下,IGV在一个面板显示数据,在另一个面板显示数据特性。拖放一个track名称,将一个track从一个面板移动到另一个地方。
6.Track名称列在最左边面板。名字的易读性取决于 tracks的高度,例如,track越小,它的名字的可读性越小。
7.属性名称被列在顶部的属性面板。彩色块代表属性值,每个独特的值被都有一个独特的颜色。鼠标放在一个颜色块的附近来查看其属性值。
------------------------------------------------------------------------------------I am a line !----------------------------------------------------------------------------------------------------------
网友评论