美文网首页『三代测序』
Sniffles:长读长数据SV检测

Sniffles:长读长数据SV检测

作者: 浩渺予怀 | 来源:发表于2019-04-18 08:51 被阅读584次

                                Sniffles使用简介


介绍:

        Sniffles用于检测长读长数据的SV。主要为Pacbio数据而设计,但对于Oxford Nanopore数据也是可以的。SV是基因组上的大片段事件(例如,deletion,duplication,insertion,inversion and translocation)。Sniffles能检测这些类型也能检测巢式SV(例如,inversion周围存在deletion或invert duplication)。

下载:

    https://github.com/fritzsedlazeck/Sniffles/releases

安装:

wget https://github.com/fritzsedlazeck/Sniffles/archive/master.tar.gz -O Sniffles.tar.gz

    tar xzvf Sniffles.tar.gz

    cd Sniffles-master/

    mkdir -p build/

    cd  build/

    # 可下载编译好的cmake进行软件的编译

    cmake ..

    make

快速使用:

    ./sniffles -m mapped.sort.bam -v output.vcf

    -m    排序后的BAM文件

-v     输出vcf文件

群call(population SV calling)

以下介绍如何使用Sniffles和SURVIVOR获取多样本VCF文件

(1)获取各个样本的VCF

首先使用sniffles对各个样本进行SV的鉴定:

    sniffles -m my_sample.bam -v my_sample.vcf

(2)合并多个样本的VCF

首先,获取SURVIVOR软件,下载:https://github.com/fritzsedlazeck/SURVIVOR

使用说明:https://github.com/fritzsedlazeck/SURVIVOR/wiki

a. 合并文件前需要进行排序

b. 将所有VCF文件的路径放入一个文件,例如:

    ls *sample.vcf > vcf_files_raw_calls.txt

c. 使用SURVIVOR将这些文件进行合并,生成一个VCF文件:

    SURVIVOR merge vcf_files_raw_calls.txt 1000 1 1 -1 -1 -1merged_SURVIVOR_1kbpdist_typesave.vcf

该步骤生成了共有的SV事件,但是没有保留各个样本特有的SV信息。

(3)强制检测所有样本的SVs

基于全部样本再次运行sniffles,例如:

sniffles -m my_sample.bam -v my_sample_gt.vcf --Ivcfmerged_SURVIVOR_1kbpdist_typesave.vcf

当各个样本完成运行后,再次合并VCF文件,同样将上述VCF文件路径写入到一个文件,例如:

ls *sample_gt.vcf > vcf_files_gt_calls.txt

然后运行SURVIVOR:

SURVIVOR merge vcf_files_gt_calls.txt 1000 -1 1 -1 -1 -1 merged_gt_SURVIVOR_1kbpdist_typesave.vcf

(The -1 for the minimum SV caller is necessary to obtain all calls even if they might be 0/0 in all samples.)

参考文献:

[1] Accurate and fast detection of complex and nested structural variations using long read technologies. Biological Data Science, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 26 - 29.10.2016.

[2] NGMLR: Highly accurate read mapping of third generation sequencing reads for improved structural variation analysis. Genome Informatics 2016, Wellcome Genome Campus Conference Centre, Hinxton, Cambridge, UK, 19.09.-2.09.2016.

[3] Transient structural variations have strong effects on quantitative traits and reproductive isolation in fission yeast. Nature communications, Vol. 8, 14061, 24.01.2017, p. 1-11. DOI:10.1038/NCOMMS14061.

[4] Accurate detection of complex structural variations using single-molecule sequencing. Nature Methodsvolume 15, pages461–468 (2018).


相关文章

  • Sniffles:长读长数据SV检测

    Sniffles使用简介 介绍: Sniffles用于检测长读长数据的SV。主要为Pacbio数据而设计,但...

  • HiFi测序精确定位致病变异

    HiFi测序作为PacBio的明星选手,兼具长读长(10-20Kb)和高准确度(≥99%)双重优势,特别适合SV的...

  • software01

    Sniffles https://github.com/fritzsedlazeck/Sniffles[https...

  • XCAVATOR检测CNV

    XCAVATOR 软件 检测CNV的方法 当前,检测SV的主要方法有如下4种: 1.1 read count/de...

  • 5 reshape2

    数据分析时要长数据 长数据有一列数据是变量的类型,有一列是变量的值。长数据不一定只有两列。ggplot2需要长类型...

  • reshape2

    揉数据,数据格式,长宽变形 melt 宽数据=>长数据(逆透视) cast 长数据=>宽数据 (透视)(dc...

  • 长“长”长“长”

    ✨ 如果可以,那我就开始练:【鸡鸡长长实验】闭上眼睛,放松全身,把意念集中在JJ上,不断念着:“JJ长长……长长…...

  • reshape2数据汇总

    dcast:长数据变短数据,数据变形,汇总 长数据 由1式,得到短数据: melt:短数据变长数据 短数据: 由式...

  • 哭着哭着就笑了

    Life is made up of sobs, sniffles, and smiles, with sniff...

  • R语言笔记Day1(六 tidyr)

    1、tidyr包的下述四个函数用法: 1)gather—宽数据转为长数据; 2)spread—长数据转为宽数据; ...

网友评论

    本文标题:Sniffles:长读长数据SV检测

    本文链接:https://www.haomeiwen.com/subject/ewwawqtx.html